CI-Fotocommunity

Registriere Dich jetzt kostenlos!

Dadurch bekommst Du Zugang zu dem geschützten Mitgliederbereich, kannst beim Gebrauchtmarkt mitmachen und stellst nebenbei auch noch sicher, dass niemand Dir Deinen Wunsch-Usernamen wegschnappt.

Statt Fotokopie ein Foto machen

C

Cetwagner

Hallohallo!

Es kommt immer wieder vor, dass ich Texte aus Büchern und Zeitschriften für die Arbeit am Rechner brauche. Im günstigen Fall kann ich die Texte via Scanner und ocr-Software auf die Festplatte schieben. Das funktioniert mal mehr, mal weniger gut, je nach Vorlage (Kontraste, Farbigkeit etc.). Glücklicherweise bietet die scannersoftware eine Option "S/W-Kopie" an und das Ergebnis ist in der Regel für die ocr-Software lesbar.
Und jetzt der ungünstige Fall mit der Bitte um den effektiven Lösungsvorschlag:
Ungünstig sind Situationen, in denen die begehrte Literatur zu teuer oder nicht ausleihbar ist, ich aber mit der braven d70 im Anschlag stehe und ruckzuck das Material im Kasten habe.
Zuhause angekommen, der Rechner brummt und macht die CF-Karte leer, muss ich die Fotos von der Literatur in einen Zustand bringen, dass die OCR-Software damit etwas anfangen kann. Weiss ist nicht weiss, sondern gelb (also die Papierfarbe) und schwarz ist lichtes Grau (also der gedruckte Text) und die OCR ist vollkommen überfordert, bröselt mir kryptische Zeichen auf den Monitor.

Wie also, so frage ich euch, kann man Texte zügig fotografieren (Kameraeinstellung) und diese Fotos ebenso zügig bearbeiten (PShop), dass man für die OCR lesbare Vorlagen in der Qualität hochwertiger Fotokopien erhält? Die beste Einsendung wird mit Schokolade (die Kugel) oder Musik (Don Giovanni) bedacht.
Grüße an alle, Tom
 
Die Bilder mit Photoshop s/w machen und eine Auto-Tonwertkorrektur drüberlaufen lassen.

Das kannst du in Photoshop auch automatisieren.
 
> Hallo Tom

Wenn Du sagst, dass weiss gelb geworden ist, hast Du vergessen die Belichtung zu korrigieren. Eine Vorlage, die mehrheitlich weiss ist, sugeriert dem Belichtungsmesser der Kamera ein stark beleuchtetes Grau. Also schliesst die Blende vielleicht ein bis zwei Stufen. Du musst also 1 - 2 Blenden zugeben. Das hat mit Digital oder Analog nichts zu tun, das war schon immer so. Du machst am besten mal Belichtungsreihen. Auch die Beleuchtung selber spielt eine Rolle. Sie sollte von links und rechts in etwa 45 Grad von der optischen Achse leuchten. So gibt es am wenigsten Refelxionen. Und damit das ganze auch wirklich schön scharf wird, sollte es vielleicht nicht gerade ein billiges Kitobjektiv sein. Idealerweise verwendet man dazu ein gutes Makroobjektiv. Ach ja, und die Kamera gehört aufs Stativ. wenn Du das schon mit einer digitalen machst. müsstest Du auch dem Weissabgleich ein wenig Aufmerksamkeit schenken.

Grüsse Hans
 
Hallo,

schon öfter habe ich mit der D70 und dem Kitobjektiv Bilder von Texttafeln bei Ausstellungen gemacht, die zum Teil mehr als eine DIN A 4-Seite (gemessen an normalem Schreibmaschinentext) enthielten.

Die Bilder habe ich, wenn es mir erforderlich erschien, in Helligkeit und Kontrast bearbeitet (PSP9), von FineReader 7.0 Prof. einlesen und nach Word kopieren lassen, was sehr schnell geht.

Fehler sind dabei selten und Bilder, die zwischen Text stehen, werden auch an der richtigen Stelle wiedergegeben.

Manche Texttafeln kann man mit normalen Mitteln nicht ohne perspektivische Verzerrungen (gewissermaßen stürzende Linien) aufnehmen. Falls erforderlich, entzerre ich solche Bilder - aber fast immer kommt FineReader 7.0 auch damit ohne weiteres zurecht.

Die Bilder habe ich immer aus der Hand gemacht. Ich werfe nur anschließend einen Blick auf das Display und es genügt, wenn die Schrift sich vom Hintergrund abhebt und das Bild auf der Vergrößerung im Display nicht erkennbar unscharf aussieht.

Auch Buchseiten oder Texte aus Zeitschriften habe ich auf diese Weise eingelesen, und wenn Buchseiten innen nicht stark umgebogen sind, liest FineReader sie problemlos.

Es empfiehlt sich, die Rechtsschreibprüfung erst im Schreibprogramm (hier: Word 2003) einzuschalten. Man kann dort besser Fachtermini in das eigene Wörterbuch einstellen und zur Korrektur anwenden.

Bei diesem Verfahren bleibt, wenn man es so einstellt, auch die Formatierung der Schriften erhalten: Schriftart, -Größe, Kursiv, Unterstrichen, Eingerückt, Numeriert usw.
Mehrspaltige Texte werden korrekt wiedergegeben. (Wenn die Silbentrennung nicht richtig funktioniert, muß man Word so einstellen, dass die von FineReader 7.0 am Zeilenende eingesetzten "freien" Trennzeichen als solche erkannt und auch von Word in Trennzeichen umgewandelt werden.

Auch englische oder französische Texte kann man einschließlich Rechtschreibprüfung so in vom PC lesbare und vor allem durchsuchbare Texte transferieren.

In ganz schwierigen Fällen (z. B. grüne Schrift auf rotem Grund) kann man sowohl über die Bildbearbeitung als auch über Finereader 7.0 Einstellungen finden, mit denen die gewünschten Ergebnisse zu erzielen sind.

Grüße,
Heinz
 
Ich habe zwar nur den Abby Finereader 5.0, wüsste aber gerne, ob das Einlesen der Bildinformationen auch damit funktioniert.

Könnte mir jemand mal den Ablauf unter 7.0 schreiben? Ich habe das "Problem" permanent, dass ich Texte einarbeiten muss und würde mich freuen, wenn ich endlich vom Scanner wegkäme ... (ist einfach zu zeitaufwändig gegenüber die schnelle Aufnahme über DSLR am Reprostativ) ...
 
Hallo Helmut,

das beigefügte Bild habe ich mit der D70 fotografiert, mit 50% Komprimierung in PSP9 als jpg-File gespeichert und in Finereader 7.0 mit "Bild öffnen" geladen.

Dann auf "Lesen" geklickt und mit einem weiteren Klick nach Word2003 übermittelt.

Dies ist das von mir unveränderte Ergebnis:

-----------------
Quarzit-Geschiebe, ein sehr hartes Gestein, vom Eis aus Scandinavien herangebracht mit Gletscherschrammen und Schliff durch Sand im Wind, sowie den seltenen Parabelrissen, die durch den großen Druck des bewegten Eises auf den festliegenden Stein entstanden. Gefunden in den Rosenbergen. Der zweite Stein, an dem in Mecklenburg Parabelrisse entdeckt wurden.
--------------------

Das Ausgangsbild sieht so aus:

85593.jpg


Dieses Bild habe ich gewählt, weil daraus ersichtlich ist, dass Finereader7.0 auch mit schwierigeren Vorlagen gut zurechtkommt. Das Bild habe ich unter ungünstigen Lichtverhältnissen bei bedecktem Wetter im dichten Wald gemacht. Man könnte es durch Umwandlung in ein Bild mit Grauwerten und durch Kontrastverstärkung natürlich noch geeigneter für einen Scan machen, aber das ist, wie man sieht, nicht erforderlich.

Ich habe die Überschrift, für die ich einen eigenen Rahmen hätte setzen müssen, der Einfachheit halber weggelassen. Aber auch Bilder bindet Finereader7.0 ganz gut ein.

Texte aus Büchern, Zeitschriften usw. können normalerweise viel besser abgebildet werden und stellen dann eine noch günstigere Vorlage dar.

Grüße, Heinz
 
Hallo Heinz!

Vielen Dank für Deine Ausführungen.

Ich habe Dein Bild mal zum Testen "ausgeborgt" und das kam heraus:

uarzit - Geschiebe!
>uarzit-Gesc hiebe, ein sehr hartes Gestein, vom Eisi aus Scandinavien herangebracht mit Gletscher-schrammen und Schliff durch Sand im Wind, sowie' den seltenen Parabelrissen, die durch den großen | Druck des bewegten Eises auf den festliegenden i Stein entstanden. Gefunden in den Rosenbergen. Der zweite Stein, an dem in Mecklenburg l Parabelrisse entdeckt wurden, . l


Liegt sicher an der geringeren Auflösung und wird von mir jetzt mit anderen Aufnahmen gecheckt.

Auf jeden Fall ist das die Richtung in die ich weitergehen werde.

Dann kann ich endlich mein Archiv an Zeitungsartikeln komplett digital aufbereitet archivieren und die Infos werden suchfähig.

KLASSE und noch einen schönen Abend ...

Helmut
 
Noch eine Ergänzung ...

Repro mit CP 8800 und einlesen in Finereader 5.0 ergab 100 Prozent-Ergebnis ... sitze gerade laut jubelnd am Schreibtisch ...

Nochmals besten Dank! Jetzt gehe ich in die "Massenfertigung" :)
 
Gerne geschehen, Helmut,

freut mich, dass es so gut funktioniert.

Was mein Bild betrifft, so könnte das schwächere Ergebnis auch durch Unterschiede zwischen den Versionen 5.0 und 7.0 entstanden sein, zwischen denen einige Jahre und einiges an Weiterentwicklung liegen.

(Für den Fall, dass Probleme bei der Silbentrennung - vor allem in mehrspaltigen Texten - auftreten sollten, habe ich in meinem obigen Beitrag vom 14.09.05 etwas geschrieben.)

Inzwischen gibt es die Version 8.0, die eine zusätzliche Vorrichtung hat, um digitale Bilder sicherer einzulesen, z. B. solche, die gebogene Textlinien aufweisen, wie sie bei Aufnahmen von Büchern oft unvermeidbar sind.

Weiterhin viel Erfolg!

Grüße,
Heinz
 
Zurück
Oben