Gescannte Dokumente liegen oft als Bilder vor — ohne durchsuchbaren Text. UnblockPDF wandelt Ihre Scans in durchsuchbare PDF-Dokumente um und fügt per OCR eine Textebene hinzu. So werden gescannte Briefe, Verträge und Rechnungen durchsuchbar und auswählbar. Gescannte Dokumente sind im Grunde Fotos von Papierdokumenten — sie enthalten Pixel statt Text. Ohne OCR-Texterkennung kann der Inhalt nicht durchsucht, kopiert oder bearbeitet werden. UnblockPDF setzt eine leistungsfähige OCR-Engine ein, die auf neuronalen Netzen basiert und Text in über 100 Sprachen erkennt. Die Textebene wird unsichtbar über das Originalbild gelegt, sodass das Dokument optisch unverändert bleibt, während der erkannte Text durchsuchbar und kopierbar ist.
Ziehen Sie Ihre gescannte Datei (JPG, TIFF, PNG oder PDF) per Drag & Drop in den Konverter.
2
OCR-Sprache wählen
Wählen Sie die Sprache des Dokuments für optimale Texterkennung.
3
Durchsuchbare PDF herunterladen
Laden Sie Ihr PDF mit durchsuchbarer Textebene herunter.
Vorteile der Scan-zu-PDF-Konvertierung
OCR-Texterkennung
Automatische Texterkennung in über 100 Sprachen.
Durchsuchbarer Text
Der erkannte Text kann durchsucht, kopiert und markiert werden.
Original bleibt erhalten
Das Originalbild bleibt sichtbar — die Textebene liegt unsichtbar darüber.
Kostenlos und sicher
Keine Kosten, keine Anmeldung. Verarbeitung im Browser.
Warum sollten Sie Scans per OCR aufwerten?
Gescannte Dokumente ohne OCR sind wie Bilder — der Text ist nicht auswählbar, nicht durchsuchbar und nicht kopierbar. Durch OCR wird eine unsichtbare Textebene über das Bild gelegt, sodass Sie den Text durchsuchen, markieren und kopieren können, während das Originaldokument optisch unverändert bleibt.
So funktioniert die OCR-Texterkennung technisch
Die OCR-Verarbeitung (Optical Character Recognition) durchläuft mehrere Stufen. Zunächst wird das Scanbild vorverarbeitet: Schieflage wird korrigiert (Deskewing), der Kontrast optimiert und Rauschen entfernt. Anschließend segmentiert die Engine die Seite in Textblöcke, Zeilen und einzelne Zeichen. Jedes erkannte Zeichen wird durch ein neuronales Netz klassifiziert, das auf Millionen von Textbeispielen trainiert wurde. Danach korrigiert ein Wörterbuch-basierter Algorithmus möglicherweise fehlerhaft erkannte Zeichen anhand des sprachlichen Kontexts. Das Ergebnis ist eine unsichtbare Textebene, die exakt über dem Originalbild positioniert wird.
Tipps für optimale Scan-Ergebnisse
Die Qualität der OCR-Erkennung hängt maßgeblich von der Scan-Qualität ab. Scannen Sie Dokumente mit mindestens 300 DPI Auflösung — 600 DPI für sehr kleine Schriften oder detaillierte Dokumente. Achten Sie auf ausreichenden Kontrast zwischen Text und Hintergrund. Vermeiden Sie Schattenwurf, indem Sie den Deckel des Scanners vollständig schließen. Legen Sie das Dokument gerade auf die Scanfläche, um Verzerrungen zu minimieren. Bei Smartphone-Scans verwenden Sie eine Scan-App mit automatischer Perspektivkorrektur und Kontrastverstärkung statt der einfachen Kamera-App.