Contact
Henk SnetselaarHenk Snetselaar
Gepubliceerd op

Toegankelijkheid documenten

1. Verschillende bestandstypen
1.1 Microsoft Word; Doc(x)
1.2 Microsoft PowerPoint; PPT(x)
1.3 eBooks; ePub
1.4 Portable document format; PDF
2. Mogelijkheden om PDF bestanden beter leesbaar te maken
2.1 Hoe herken je de toegankelijkheid van een PDF bestand
2.2 Het lezen van PDF documenten met Acrobat Reader DC
2.3 Het lezen van een doorzoekbaar of niet doorzoekbaar PDF document in Word
2.4 Het omzetten van niet doorzoekbare PDF naar een meer toegankelijk formaat met Robotekst
2.5 Gebruik van XChange Editor voor het omzetten van niet doorzoekbare PDF
2.6 Gebruik van de OCR functie van de schermleesprogramma’s

 

 

1.  Verschillende bestandstypen

Er zijn veel verschillende soorten documenten in gebruik, met allemaal hun eigen kenmerken en toegankelijkheid voor visueel beperkten. In principe kunnen alle document typen volledig leesbaar zijn, maar ook compleet onleesbaar en alles daar tussen in. Teksten ingevoerd als afbeelding kan een probleem vormen en kan in ieder type voorkomen.

De toegankelijkheid van een document wordt bepaald door:

  1. De mogelijkheid de inhoud te kunnen weergeven in braille, spraak en vergroting
  2. Het kunnen begrijpen van de structuur en de leesvolgorde van het document

 

Naar snelmenu

1.1  Microsoft Word; Doc(x)

Over het algemeen zijn Word documenten redelijk tot goed toegankelijk omdat dit type document hoofdzakelijk wordt gebruikt voor digitale tekst en de hulpmiddelen voor visueel beperkten hier goed voor zijn ingericht.

Als de opmaak goed is gestructureerd en voorzien van koppen en er alleen enkelvoudige tabellen zijn gebruikt is de inhoud goed weer te geven en kan er goed in worden genavigeerd.

Afbeeldingen kunnen een probleem vormen als de auteur deze niet heeft voorzien van alternatieve tekstuele beschrijvingen.

Zie het artikel: https://www.eduvip.nl/lesmateriaal_toegankelijk_in_word/

 

Naar snelmenu

1.2  Microsoft PowerPoint; PPT(x)

Dit wordt het meest gebruikt voor presentaties in de klas, collegezaal of elders. Hoewel afhankelijk van de gebruikte elementen in de presentatie is het in de vorm PowerPoint presentatie niet erg handig in gebruik. Het wordt beter toegankelijk als je PPTX bestand van de PowerPoint presentatie met de “Save as…” functie opslaat als een PDF bestand. Dit werkt het beste met Office 2013 of latere versies.

 

Naar snelmenu

1.3  eBooks; ePub

Dit bestandstype wordt gebruikt voor ebooks die je online aanschaft als leesboek, maar ook steeds meer als studieboek. Op zich is dit een toegankelijk bestandstype omdat het eigenlijk een internetpagina is. Het probleem kan er wel in zitten dat er een DRM beveiliging op zit waardoor het bestand alleen te lezen is met de bijbehorende software zoals Adobe Digital Editions.

Soms bevatten bestanden van het type ePub gescande pagina’s van boeken waardoor ze niet toegankelijk zijn voor spraak- en braille-uitvoer zolang ze niet zijn omgezet naar tekst met een OCR programma.

Het schermleesprogramma SuperNova heeft een eigen leesprogramma voor ePub bestanden, daarnaast kunnen ze rechtstreeks worden gelezen in Microsoft Edge.

Dedicon is een project gestart om studieboeken via een gesloten bibliotheek te kunnen aanbieden in ePub3 formaat. Daarvoor wordt Bookshelf als leesprogramma gebruikt.

 

Naar snelmenu

1.4  Portable document format; PDF

Het PDF bestandstype is goed te beveiligen en behoud heel goed de weergave van de inhoud van het document in verschillende leesprogramma’s.

Het wordt gebruikt voor veel verschillende documenten zoals: (studie) boeken, artikelen, presentaties, maar ook flyers, tekeningen en zelfs voor afbeeldingen.

Dit document formaat wordt veel gebruikt voor lesboeken en professionele documenten, daarom wordt er in dit artikel veel aandacht aan besteed.

1.4.1  PDF; verschillende gradaties van toegankelijkheid

PDF wordt met veel verschillende programma’s geproduceerd omdat het documenttype ook veel verschillende soorten inhoud ondersteund. Dat resulteert ook in verschillende gradaties van toegankelijkheid. In het algemeen zijn er drie gradaties van toegankelijkheid:

  1. Niet doorzoekbare en niet getagde PDF; dit de minst toegankelijk vorm omdat het bestaat uit afbeeldingen of gescande pagina’s. Zonder omzetting met een tekstherkenningsprogramma zijn deze documenten niet te lezen met een schermleesprogramma.
  2. Doorzoekbare maar niet getagde PDF; de tekst is redelijk leesbaar met een schermleesprogramma, maar elementen zoals koppen en tabellen worden niet herkend en de leesvolgorde kan erg verkeerd zijn.
  3. Doorzoekbare en getagde PDF; beide, de structuur elementen en de tekst is beschikbaar voor schermleesprogramma’s, navigatie met koppen en tabellen is mogelijk en de leesvolgorde is correct.

 

Naar snelmenu

2.  Mogelijkheden om PDF bestanden beter leesbaar te maken

Er zijn verschillende mogelijkheden om PDF bestanden beter toegankelijk te maken. Er zijn nog wel meer document typen die niet goed toegankelijk zijn, maar die kunnen vaak gemakkelijk worden omgezet naar PDF zodat dezelfde tool kunnen worden gebruikt om ze toegankelijk te maken.

Sommige applicaties die genoemd worden kunnen ook andere bestandstypen bewerken. Als dit van toepassing is wordt dat ook vermeld.

 

Naar snelmenu

2.1  Hoe herken je de toegankelijkheid van een PDF bestand

Voordat je kunt bepalen hoe je een PDF document gaat lezen of behandelen, moet je weten welke categorie toegankelijkheid het heeft. Dit kun je bepalen door het bestand te openen in Acrobat Reader DC, de software die vaak standaard aanwezig is op Windows computers. Acrobat Reader reageert verschillend alle PDF typen, zoals hieronder beschreven.

  • Doorzoekbaar en getagd; dit document wordt zeer snel geladen. Structuur elementen zijn zichtbaar als je de snelle navigatie toetsen van het schermleesprogramma gebruikt.
  • Doorzoekbaar maar niet getagd; bij het openen komt er een dialoogvenster met de vraag welke leesvolgorde moet worden gebruikt en of het hele document moet worden geladen. Na sluiten van het document wordt de tekst weergegeven zonder structuur elementen.
  • Niet doorzoekbaar en niet getagd; bij het openen komt er een dialoogvenster met de vraag welke leesvolgorde moet worden gebruikt, maar na bevestiging wordt er geen tekst weergegeven. Afhankelijk van het soort en versie van het gebruikte schermleesprogramma kan er ook een dialoogvenster verschijnen met de mededeling dat de PDF waarschijnlijk een scan/afbeelding is en de vraag of deze moet worden omgezet naar doorzoekbare tekst.

Opmerking Bovenstaande beschreven reacties van de Acrobat Reader DC komen als het niet de eerste keer is dat het document wordt geopend. Als het wel de eerste keer is wordt er eerst een toegankelijkheid instellingenscherm doorlopen.

2.1.1  Opdracht

  • Start een schermleesprogramma en
  • open vervolgens de documenten Toegankelijk-a_1.pdf, Toegankelijk-a_2.pdf en Toegankelijk-a_3.pdf in Adobe Reader DC.
  • Beschrijf hoe het schermleesprogramma reageert op de verschillende bestanden en wat zijn de verschillen in toegankelijkheid van de documenten.

 

Naar snelmenu

2.2  Het lezen van PDF documenten met Acrobat Reader DC

PDF bestanden kunnen worden geopend in veel verschillende programma’s zoals Adobe Reader, PDF EXchange Editor, Foxit Reader etc., maar voor een schermleesprogramma is het noodzakelijk een PDF bestand in de Adobe Reader te openen omdat dit programma wordt ondersteund door de schermleesprogramma’s.

 

2.2.1  De voordelen

  • In getagde documenten is de structuur zichtbaar
  • Op de meeste computers is de Acrobat Reader DC als standaard applicatie voor PDF documenten geïnstalleerd
  • Acrobat Reader DC wordt ondersteund door alle schermleesprogramma’s

2.2.2  De nadelen

  • Het laden van grote document kost veel tijd
  • Soms wordt de positie van waar je aan het lezen was niet bewaard
  • Soms komt het voor dat de tekst van een document in heel korte regels wordt weergegeven

2.2.3  Mogelijke oplossing

  • Om de focus in het document te bewaren kun je de linker pijltjes toets indrukken en daarna de rechter voordat je het document sluit.
  • In het geval van een niet getagd of zelfs niet doorzoekbaar document kan het goed zijn om dit te openen in een andere applicatie waarmee je PDF documenten kunt lezen, bijvoorbeeld Microsoft Word 2013 of later, zie onderwerp hieronder.

2.2.4  Opdracht

  • Start een schermleesprogramma en
  • open de doorzoekbare en getagde versie, het document toegankelijk-a_3.pdf en gebruik een navigatie sneltoets, bijvoorbeeld de h en controleer of het schermleesprogramma van kop naar kop gaat en de u / k of je naar een link springt.

 

Naar snelmenu

2.3  Het lezen van een doorzoekbaar of niet doorzoekbaar PDF document in Word

Sinds Office 2013 is het mogelijk om doorzoekbare PDF bestanden te lezen en aanpassen in Word. Gebruik je Word 2016 in combinatie met Windows 10 dan is het zelfs mogelijk om niet doorzoekbare PDF, dus inhoud gebaseerd op een scan/afbeelding in Word te openen en de tekst te laten herkennen met de OCR (Optical Character Recognition) van Windows. Er zijn twee manieren om dit te doen, de werkwijze is als volgt:

  1. Openen vanuit Microsoft Word
  • Open Word, open daarna een bestand (Ctrl+O)
  • navigeer naar betreffende document
  • Open het document, (Enter)
  1. Openen vanuit de Windows Verkenner
  • Open de Verkenner en navigeer naar betreffende document
  • Open het context menu (Shift+F10) en activeer de menu optie ‘Openen met…’
  • Kies het programma Word van de lijst als het daarin staat
  • Als Word niet in de lijst staat kies je de optie ‘Kies een ander app’
  • Kies vervolgens Word in de volgende lijst, of als deze nog niet in de lijst staat op kies de optie ‘Meer apps’

2.3.1  De voordelen

  • Na openen van het PDF document kun je het gelijk lezen en aanpassen zoals een normaal Word document
  • Word probeert de opmaak gelijk te houden aan het originele document
  • Zelf ongetagde PDF, waarin geen structuur elementen aanwezig zijn probeert Word deze vast te stellen met vaak goede resultaten
  • Structuur elementen kunnen ook zelf worden toegevoegd bij het lezen van het document zodat je daar later gebruik van kunt maken

2.3.2  De nadelen

  • Het openen van grotere documenten kost wel wat tijd
  • De opmaak van de inhoud kan veranderd en onjuist zijn ten opzichte van het originele document
  • Als het gaat om een PDF op basis van afbeelding/scan kunnen er interpretatie fouten van de OCR in zijn gekomen
  • Als het gaat om een PDF op basis van tekst, maar met afbeeldingen die ook tekst bevatten zoals bijvoorbeeld een tabel, kan het zijn dat de tekst in deze afbeeldingen niet wordt omgezet naar doorzoekbare tekst. Dit komt vooral voor bij PowerPoint presentaties die wordt omgezet naar PDF.

2.3.3  Opdracht

  • Open het document Toegankelijk-a_1.pdf, waarschijnlijk krijg je een waarschuwing dat een OCR proces moet worden gestart
  • Doorloop het document en kijk of de structuur goed is geanalyseerd door Word. Zijn er bijvoorbeeld koppen en links herkend en vastgelegd in de structuur van het document.

2.3.4  Opdracht

Als je in het bezit bent van een smartphone met cloud-service ga dan verder met de volgende opdracht

  • Neem een foto van een stukje tekst
  • Sla dit foto bestand op in je cloudopslag
  • Open het bestand met Word 2016
  • Kijk of het OCR proces goed is verlopen en de structuur van het document juist is

 

Naar snelmenu

2.4  Het omzetten van niet doorzoekbare PDF naar een meer toegankelijk formaat met Robotekst.nl

Om een niet doorzoekbare PDF, of een ander bestand dat bestaat uit een afbeelding leesbaar te maken moet het worden geanalyseerd door een OCR (Optical Character Recognition) programma. Er zijn een aantal commerciële programma’s zoals Kurzweil, KNFB reader, Omnipage en Fine reader, die hiertoe in staat zijn. De mogelijkheden van Fine reader kunnen nu vrij van kosten online worden gebruikt door het document via een online formulier of per email te sturen naar de omzetservice en daarmee niet doorzoekbare PDF, maar ook JPG om te zetten naar tekstformaten zoals: txt, docx, getagde PDF, html etc. Deze service is zelfs handig om getagde PDF om te zetten waarvan je denkt dat die afbeeldingen bevat met tekst. Een voorbeeld hiervan is een redelijk toegankelijke PowerPoint presentatie met afbeeldingen van een krantenartikel of tabel die je zonder OCR niet kunt lezen.

 

2.4.1  Gebruik Robotekst.nl via het webformulier

  • Ga naar robotekst.nl
  • Gebruik de ‘Nu beginnen’ knop en selecteer het bestand dat je omgezet wil hebben met de knoppen ‘Bestand kiezen’ en ‘Uploaden’
  • Ga verder met de knop ‘Ga verder’
  • Selecteer het soort bestand waarin je wil omzetten
  • Selecteer het document-type
  • Geef je emailadres op en verstuur je aanvraag
  • Je krijgt een overzicht van de gegevens
  • Wacht op de email met het bestand of een link naar het bestand. De duur van de omzetting hangt af van de grootte van het bestand en de drukte bij het systeem en kan van een paar minuten oplopen tot wel een uur.

2.4.2  Gebruik Robotekst.nl via email

Het is ook mogelijk om Robotekst.nl een bestand om te laten via een email. Dat is vaak sneller, maar je kunt ook je smartphone gebruiken om een foto van tekst te maken en deze gelijk op te sturen.

De instructie hiervoor staat op: http://robotekst.nl/Converteer_via_email.aspx

2.4.3  De voordelen

  • Deze methode kan overal worden gebruikt, onafhankelijk van de apparatuur die je gebruikt
  • Het kan zelf een verbetering opleveren van doorzoekbare PDF bestanden als je wil controleren op tekst uit afbeeldingen
  • Robotekst levert ook een goed resultaat in het invoegen van koppen en tabellen

 

2.4.4  De nadelen

  • Geen enkele OCR is helemaal foutloos, tekst en structuur kan in enkele gevallen moeilijk zijn vast te stellen. Het resultaat is ook afhankelijk van de resolutie en kwaliteit van het opgestuurde bestand
  • Soms duurt het lang voordat het resultaat ontvangt
  • Bij lokaal geïnstalleerde OCR programma’s zoals Fire reader en Omnipage kun je de tekstherkenningsinstellingen wijzigen voor een beter resultaat, dat kan met Robotekst niet

2.4.5  Opdracht

  • Converteer het bestand Toegankelijk-c_1 via het webformulier op robotekst.nl naar een Word document
  • Controleer de correctheid van de tekst van het resultaat
  • Controleer de structuur elementen in het document op de juistheid zoals koppen, links en lijsten met een schermleesprogramma

 

Naar snelmenu

2.5  Gebruik van XChange Editor voor het omzetten van niet doorzoekbare PDF

De gratis versie van de PDF Exchange Editor is een PDF reader, maar heeft ook een OCR mogelijkheid. In het menu item Converteer vind je de optie ‘OCR pages’. Je kunt de huidige pagina, meerdere pagina’s of het hele document omzetten naar doorzoekbare tekst. Je kunt ook de taal en de nauwkeurigheid instellen.

 

2.5.1  De voordelen

  • De PDF EXchange Editor is een gratis programma en heeft ook goede mogelijkheden om PDF documenten te annoteren
  • Het programma heeft een paar toegankelijkheidsmogelijkheden voor slechtzienden, zoals document achtergrond en tekst kleur en grootte
  • Je hebt instellingsmogelijkheden voor het OCR proces
  • Je hebt de keuze om de originele inhoud van het document te behouden en een tekst layer toe te voegen of om een doorzoekbare PDF te maken

2.5.2  De nadelen

  • De PDF EXchange Editor is niet toegankelijk voor schermleesprogramma’s

2.5.3  Opdracht

  • Converteer het document Toegankelijk-c_1.pdf met de OCR functie van de EXchange Editor naar een doorzoekbaar pdf bestand. De tekst wordt omgezet maar de opmaak wordt behouden.
  • Converteer het doorzoekbare resultaat in Word naar een Word document met een opmaak in 1 kolom

 

 

Naar snelmenu

2.6  Gebruik van de OCR functie van de schermleesprogramma’s

Met de huidige versie van de schermleesprogramma’s is het mogelijk om niet doorzoekbare tekst in PDF bestanden of afbeeldingen om te zetten naar doorzoekbare tekst.

2.6.1  Jaws

Er zijn verschillende manieren om de OCR functie van Jaws te gebruiken.

  1. Als een niet doorzoekbare PDF wordt geopend wordt dat door Jaws herkend en komt met een dialoogvenster met mededeling dat het document mogelijk bestaat uit grafische tekst en de vraag het document om te zetten naar doorzoekbare tekst.
    Je hoeft alleen maar te bevestigen en het proces start automatisch en de tekst wordt in de tekst viewer van Jaws weergegeven.
  2. Als je weet dat een PDF of ander afbeeldingsbestand uit niet doorzoekbare tekst bestaat kun je het bestand selecteren in Windows Verkenner, vervolgens naar het context menu gaan met Shift+F10 en zoeken naar de optie ‘Herkennen met Jaws’. De omgezette tekst wordt getoond in de Jaws Viewer.
  3. Als je tijdens het lezen van een document een grafische knop of afbeelding tegenkomt kun je de OCR functie op de volgende manieren inschakelen:
    Ga naar de gelaagde commando’s met Ins+Spatie, vervolgens kies je de O om het OCR proces te starten, gevolgd door een letter om de situatie aan te geven. Hiervoor zijn de volgende vervolg letters beschikbaar:
    – C, om een tekst van een camerabeeld te herkennen
    – W, voor het herkennen van het huidige applicatie venster
    – S, voor het herkennen van het volledige scherm
    – ?, voor het oproepen van een korte helpboodschap die de commando’s beschrijftAls je een afbeelding met tekst tegenkomt en één van de bovenstaande commando’s gebruikt, zal Jaws de tekst direct omzetten en kun je er met de Jaws cursor doorheen navigeren. Om de omgezette tekst te herkennen van de originele tekst wordt er een andere stem gebuikt. De herkende tekst wordt op dezelfde plek weergegeven als de afbeelding.

2.6.2  Opdracht

  • Gebruik de OCR functie methode 1 of 2 om het oefenbestand Toegankelijk-b_1.pdf om te zetten naar doorzoekbare tekst.
  • Controleer het resultaat op correctheid en document structuur met Jaws

 

2.6.3  NVDA

In NVDA gebruik je een OCR.nvda-addon, of de OCR engine van Windows 10.

Het commando is NVDA+R

 

2.6.4  SuperNova

Hierbij heb je alleen de mogelijkheid om een document om te zetten naar doorzoekbare tekst. De OCR functie is te vinden onder het menu item Media en vervolgens Scan en Lezen. Je hebt de mogelijkheid van:
– Uit Bestand,
– Vanaf Scanner of
– Vanaf Klembord.
Het resultaat is een apart bestand dat wordt opgeslagen naar de gewenste map.

2.6.5  Opdracht

  • Gebruik de OCR functie ‘Uit Bestand’ om het oefenbestand Toegankelijk-b_1.pdf om te zetten naar een doorzoekbaar Word bestand.
  • Controleer het resultaat op correctheid en document structuur met SuperNova
Toegankelijk-a_1
Titel: Toegankelijk-a_1 (20 clicks)
Onderschrift:
Filename: toegankelijk-a_1.pdf
Size: 2 MB
Toegankelijk-a_2
Titel: Toegankelijk-a_2 (19 clicks)
Onderschrift:
Filename: toegankelijk-a_2.pdf
Size: 2 MB
Toegankelijk-a_3
Titel: Toegankelijk-a_3 (35 clicks)
Onderschrift:
Filename: toegankelijk-a_3.pdf
Size: 687 KB
Toegankelijk-b_1
Titel: Toegankelijk-b_1 (18 clicks)
Onderschrift:
Filename: toegankelijk-b_1.pdf
Size: 733 KB
Toegankelijk-b_2
Titel: Toegankelijk-b_2 (20 clicks)
Onderschrift:
Filename: toegankelijk-b_2.pdf
Size: 741 KB
Toegankelijk-b_3
Titel: Toegankelijk-b_3 (19 clicks)
Onderschrift:
Filename: toegankelijk-b_3.pdf
Size: 189 KB
Toegankelijk-c_1
Titel: Toegankelijk-c_1 (21 clicks)
Onderschrift:
Filename: toegankelijk-c_1.pdf
Size: 528 KB

Deel dit artikel