Wie ein gescanntes Dokument mit Text im PDF Format durchsuchbar machen?

1 Antwort

Hallo brunner, wenn ich recht verstehe, hast Du vor allem einen Text als Bild eingescannt. Dass das Ausgabeformat PDF heißt, ist eher beiläufig, macht für Deine Aufgabenstellung aber Sinn.

Lösen wirst Du das Problem in solchen Fällen nur, wenn Dein Drucker / Scanner OCR beherrscht, das heißt eingescannten Text von pixelbasierten Bilddaten wieder in Text zurückverwandeln kann. Die meisten, etwas höherwertigen Drucker liefern bereits entsprechende Lösungen in ihren Programmpaketen mit.

Allerdings kann es bedeuten, dass Du den Scan noch einmal durchführen musst. Die Auflösung sollte entsprechend hoch, das Kontrastverhältnis hart und die Farbtiefe ziemlich gering sein, damit Du gute Ergebnisse erzielst.

Da es sich um einen recht aufwändigen Ablauf handelt, musst Du leider mit ziemlich langer Bearbeitungsdauer rechnen. Es kann auch sein, dass dieser Weg nur offen steht, wenn tatsächlich die Desktop Software genutzt wird, ich spreche also nicht von der "Ein-Knopf-Ein-PDF" Variante, die viele Drucker am Gerät selbst anbieten.

Schau am besten mal in der Doku Deines Druckers nach, genauer kann ich es nicht beantworten, weil ich Deine Hardware nicht kenne.

Evtl. hilft Dir auch die hier genannte Software weiter: http://de.wikipedia.org/wiki/Texterkennung#OCR-Software

PDF-Dateien ins CBR-Format umwandeln?

Guten Morgen,

ich habe mir die Mühe gemacht und habe meine Comic-Sammlung mit dem Scanner digitalisiert. Ich dachte mir -wegen der Auflösung- sei PDF das richtige Format. Nun habe ich auch gesehen, dass man sich Comics auf dem Smartphone ansehen kann und würde sie deswegen gerne auf mein Samsung Spica (Android 2.1) kopieren. Um sie zu betrachten, müssen sie aber im CBR-Format vorliegen. Wie kann ich die PDFs in dieses Format wandeln?

...zur Frage

Kann ich in ein PDF Dokument ein Bild einfügen?

Habe mit dem PDF-Creator ein Dokument, was vorher eingescannt wurde, erstellt und will nachträglich noch ein Bild einfügen. Klappt aber weder mit Kopieren -Einfügen noch mit ausschneiden - einfügen. Hat jemand eine Idee, wie es gehen könnte?

...zur Frage

Überprüfen, ob Schriften in einem PDF Dokument eingebettet sind

Hallo,

ich verwende Ubuntu und wollte fragen, ob jemand eine Möglichkeit kennt, mit der man prüfen kann, ob Schriften in einem PDF Dokument eingebettet sind?

Ich habe drei PDFs mit dem "PDF Creator" erzeugt und hatte "Schriften einbetten" aktiviert. Normalerweise lässt sich mit Acrobat Reader unter Datei-Einstellungen einsehen, ob die Schriften eingebettet sind. Dort steht dann "Eingebettete Schriftgruppe". Das war nicht der Fall. Jetzt habe ich die PDFs zum Verlag geschickt und man sagte mir, dass in einem Dokument die Schriften nicht eingebettet seien... bin jetzt etwas ratlos. Ich suche also nach einer (anderen) einfachen Möglichkeit, mit der ich abfragen kann, ob die Schriften eingebettet sind. Unter Ubuntu am besten.

...zur Frage

Was möchtest Du wissen?