Epson WF-7610D
Als je scant vanaf de printer zelf en PDF kiest, worden de letters herkend (Adobe Acrobat Reader zegt bij het openen van een gescand bestand "Er is een fontpakket vereist …). Onlineocr.net werkt dan goed als OCR-tool.
PDF2TXT
In the old days
MyMorph (PDF => TIFF)
http://docmorph.nlm.nih.gov/docmorph/
But for some time, it doesn't work anymore and only shows "Down for maintenance":
http://www.pdfaid.com/pdf-to-tiff.aspx
limitations: max. file size 20 MB
- Compression type: choose LZW or AdobeFlate???
- DPI: 300
28/03/2024: ook deze functioneert niet meer: als je een .pdf inlaadt, krijg je een 404 | This page could not be found.
Nowadays
Text based PDF's (PDF => TIFF)
28/03/2024:
https://pdf2tiff.com/ => 'k weet het toch niet zo hoor...
Image based PDF's (PDF => DOCX)
PDF2PNG
pdf2png
http://pdf2png.com
- kleurgetrouw aan de pdf
- scherp beeld
- toch voldoende gecomprimeerd
- ondersteunt geen transparantie
Convertio
https://convertio.co/nl/pdf-png/
- ondersteunt transparantie
- lichtere kleuren dan op de originele pdf
PNG2TXT
- heel goed: online-convert.com (taalkundig 100% correct, alleen de afbrekingen zijn niet juist, maar dat is verstaanbaar)
- beter: freeconvert.com (hier en daar wordt een letter fout geïnterpreteerd)
- slecht: online2pdf.com (woorden worden onderbroken, aanhalingstekens toegevoegd, letters fout geïnterpreteerd)
Screenshot
Wil je een screenshot omzetten naar tekst, dan kan dat via bv. volgende online tool:
http://www.structurise.com/screenshot-ocr/
Rotate PDF by free angle
- go to pdfescape.com
- upload your pdf
- click on the Page tab
- choose More
- click on Deskew
- then rotate your page by drawing a line underneath a supposedly horizontal paragraph
Split PDF
PDF24
- open the PDF24 Launcher
- click on File Tools
- click on the + icon to add a file
- in the Please select a tool section, scroll down and click on Split page by page (NOT 'Extract pages')
- then save the folder
iLovePDF
Merge PDF
- PDF24 >
- Bestand-instrumenten >
- +-icoontje bovenaan links: selecteer te samen te voegen bestanden
- Samenvoegen...
- Kies een profiel: Goede kwaliteit
- standaard wordt het samengevoegde bestand opgeslagen in de map waarin de oorspronkelijke pdf'en staan
- de bestandsnaam is de mapnaam.pdf
Crop PDF
If you google 'crop PDF', a lot of online tools are presented, but the easiest way I found, was through the following site:
General
A general site where you can convert all kinds of documents to other formats, is this one:
https://www.online-convert.com/
PDF size and resolution
For an
A4 page, go for the following settings if you need to
print the page:
A4 at 300 dpi = 2480 x 3508 px print resolution (or 595 x 842 px screen resolution)
How do you get a PDF that's not too big?
- scan as jpeg (600 dpi = 4960 x 7016 px, 300 dpi = 2480 x 3508 px)
- resize 50% if 600 dpi
- Microsoft Print to PDF (= always 600 x 600)
- PDF24: Compress/Comprimeren: choose 300DPI, color model and 'Geoptimaliseerd voor web'
Misschien kun je toch PDF24 meteen gebruiken:
- Bestand-instrumenten
- kies dan 'Samenvoegen...'
- vervolgens, na de eerste fase, 'Goede kwaliteit'
PDF24 geeft voor mijn toepassingen in ieder geval betere kwaliteit in een kleiner bestandsformaat dan Bullzip.
PDF resizen
Ik had een .pdf-bestand waar de tekst linksboven stond, en rechtsonder veel witruimte. Om die naar A4 te herschalen, heb ik gebruikgemaakt van:
Document properties - page size, vooraf: 7.88 x 12.06 in
Document properties - page size, achteraf: 11.01 x 15.58 in
PDF24 ook geprobeerd, maar toen stond er bij de page size 'Varies'...
PDF verkleinen / Compress PDF
Ik had enkele (oude, vergeelde) zwart-witdocumenten ingescand, in kleur, omdat dat voor de leesbaarheid duidelijk beter was, maar had dan enorm grote PDF-bestanden.
Ik heb die online verkleind/gecomprimeerd via
PDF24 Tools:
Ik heb het niet in de offline tool gedaan, daar kun je ook nog Web optimized aanvinken - geen idee welke invloed dat precies heeft op het resultaat.
In
PDF24 Creator: choose
Compress PDF
- wijzig dan Color model in GRAY
- vink Web optimized aan
In ieder geval, bij de in kleur ingescande PDF's ging één document van 133 MB naar 12 MB, terwijl de leesbaarheid goed bleef.
Decode Base64 images to SVG
Remove text from PDF
tags
merge image images pdf txt png