|
 |
|
|
|
|
|
OCR ist die Abkürzung für Optical Character Recognition = (Optische Zeichenerkennung).
Verfahren, mit dem gedruckte Texte in den Computer "eingelesen" (digitalisiert) werden.
Die Vorlage gelangt zunächst in bzw. unter ein Lesegerät (Scanner) . Eine spezielle Software identifiziert dann die einzelnen Buchstaben, Zahlen und sonstigen Zeichen.
Leistungsfähige OCR - Software arbeitet heute mehrstufig: Sie analysiert zunächst den Seitenaufbau, dann folgt die Zeichenerkennung, und
zwar - in
a.)
eine Überdeckungsanalyse (Übereinstimmung mit gespeichertem Muster),
b.)
eine Topologieerkennung (Zahl und Verlauf der Linien eines Buchstabens werden analysiert).
Abschließend findet ein Vergleich der Wörter mit einem internen Wörterbuch statt. Dies ermöglicht Trefferquoten von über 98 Prozent.
Bestimmte Schriftarten und - stile sowie schlechte Druckqualität oder geringe Schriftgrößen bereiten allerdings Schwierigkeiten. Die meisten Programme sind "lernfähig"; der Anwender kann vorgeben, wie nicht erkannte Zeichen identifiziert werden sollen. Diese Vorgaben werden dann berücksichtigt.
Möchten Sie die Leistung eines OCR-Programms austesten, haben aber keinen Scanner, können Sie wie folgt vorgehen:
Schreiben Sie einen Text in Winword oder mit Notepad. Drücken Sie auf die Druck-Taste.
Starten Sie Ihr favorisiertes Grafikbearbeitungsprogramm und kopieren Sie den Inhalt des Zwischenspeichers in ein Bild. Speichern Sie dieses Bild als TIF- oder BMP-Datei ab.
Laden Sie sich die Software CuneiForm OCR 3.1 von der Internetseite www.xiazai.net und weisen Sie diesem Programm, nach Installation, die gespeicherte Bilddatei zu.
Handschriften können von OCR - Software i.d.R. nicht verarbeitet werden
(Handschrifterkennung) .
Bei vielen handelsüblichen Scannern ist im beiliegenden Software-Paket auch eine OCR-Software enthalten.
Siehe auch Software zur Spracherkennung
|
|
|
|
|
|
|
Person(en): Zeitraum: Firma: |
kein Eintrag vorhanden - - kein Eintrag vorhanden |
|
Es gibt 46 weiterführende Erklärungen oder Definitionen:
Abschließen, Analyse, Anwender, BMP, Char, Character, Computer, Datei, Digital, ELAN, Gerät, Grafik, Handschrifterkennung, HTML, HTTP, iCal, Installation, laden, Licht, Notepad, Paket, Programm, Quote, Rach, Scanner, Schließen, Schreiben, Schrift, Schriftart, Schriftgröße, Seite, Software, Speicher, Sprache, Spracherkennung, Text, Tile, Topologie, Vorlage, WinWord, Wörterbuch, Word, Zahl, Zeichen, Zeichenerkennung, Zwischenspeicher
|
|
Veröffentlicht am: Zuletzt bearbeitet am: Referenz: |
15.04.2004 von Wilhelm Janssen (7094) Beiträge 09.10.2004 von Wilhelm Janssen at-mix |
|
|
|
 |
|
|
|
|
|
|
|
|
|
|

Bei WinTotal finden Sie Programme und Tools für Microsoft Windows
|
|
| Werbung |
|
| | | | |
|

Bei Validome können Sie Ihre Website auf barrierefreies HTML testen
|
|
|