Frage von brunner,

Wie ein gescanntes Dokument mit Text im PDF Format durchsuchbar machen?

Ich habe einige PDFs auf dem Rechner welche einfach eingescannt wurden, also der Text darin ist nicht markierbar oder durchsuchbar. Da es sich um sehr große Dateien handelt suche ich eine (möglichst) kostenlose Möglichkeit, diese PDF Dateien durchsuchbar zu machen. Was kann man dafür hernehmen ohne ein sehr teures Programm zu kaufen?

Antwort von derwendtde,
2 Mitglieder fanden diese Antwort hilfreich

Hallo brunner, wenn ich recht verstehe, hast Du vor allem einen Text als Bild eingescannt. Dass das Ausgabeformat PDF heißt, ist eher beiläufig, macht für Deine Aufgabenstellung aber Sinn.

Lösen wirst Du das Problem in solchen Fällen nur, wenn Dein Drucker / Scanner OCR beherrscht, das heißt eingescannten Text von pixelbasierten Bilddaten wieder in Text zurückverwandeln kann. Die meisten, etwas höherwertigen Drucker liefern bereits entsprechende Lösungen in ihren Programmpaketen mit.

Allerdings kann es bedeuten, dass Du den Scan noch einmal durchführen musst. Die Auflösung sollte entsprechend hoch, das Kontrastverhältnis hart und die Farbtiefe ziemlich gering sein, damit Du gute Ergebnisse erzielst.

Da es sich um einen recht aufwändigen Ablauf handelt, musst Du leider mit ziemlich langer Bearbeitungsdauer rechnen. Es kann auch sein, dass dieser Weg nur offen steht, wenn tatsächlich die Desktop Software genutzt wird, ich spreche also nicht von der "Ein-Knopf-Ein-PDF" Variante, die viele Drucker am Gerät selbst anbieten.

Schau am besten mal in der Doku Deines Druckers nach, genauer kann ich es nicht beantworten, weil ich Deine Hardware nicht kenne.

Evtl. hilft Dir auch die hier genannte Software weiter: http://de.wikipedia.org/wiki/Texterkennung#OCR-Software

Antwort von Avita,
2 Mitglieder fanden diese Antwort hilfreich

Hol Dir von einer sicheren Seite, dazu gehören generell die Webseiten der bekannten PC-Fachzeitschriften, die aktuelle Version des kostenlosen "Libre Office".

Damit kannst Du PDFs bearbeiten.

Hier eine sehr gute Videoanleitung, die Dir darstellt, wie es geht.

http://www.youtube.com/watch?v=DMuHYcuOTww

Kommentar von reschif,

bei dem genannten Fall ist eher ein Bildbearbeitungsprogramm anwendbar, welches aber das Problem nicht löst. Libre Office enthält keine OCR Software, welche hier erst mal zum Einsatz kommen muß.

Antwort von ScienceFreak,
1 Mitglied fand diese Antwort hilfreich

Lad es bei Google Docs hoch und stell ein, dass es ins Google eigene Office Format konvertiert wird dann wird es per OCR umgewandelt und kannst es durchsuchen :)

Keine passende Antwort gefunden?

Verwandte Fragen

Fragen Sie die Community