Internet Lexikon Startseite

OCR - Info

Copyright by at-mix
Spacer Spacer
Glossar | Kategorie wählen | Hilfe Fehler?

OCR

Schrift-und-Druck
OCR ist die Abkürzung für Optical Character Recognition = (Optische Zeichenerkennung).

Verfahren, mit dem gedruckte Texte in den Computer "eingelesen" (digitalisiert) werden.

Die Vorlage gelangt zunächst in bzw. unter ein Lesegerät (Scanner) . Eine spezielle Software identifiziert dann die einzelnen Buchstaben, Zahlen und sonstigen Zeichen.

Leistungsfähige OCR - Software arbeitet heute mehrstufig: Sie analysiert zunächst den Seitenaufbau, dann folgt die Zeichenerkennung, und zwar - in

a.)
eine Überdeckungsanalyse (Übereinstimmung mit gespeichertem Muster),

b.)
eine Topologieerkennung (Zahl und Verlauf der Linien eines Buchstabens werden analysiert).

Abschließend findet ein Vergleich der Wörter mit einem internen Wörterbuch statt. Dies ermöglicht Trefferquoten von über 98 Prozent.

Bestimmte Schriftarten und - stile sowie schlechte Druckqualität oder geringe Schriftgrößen bereiten allerdings Schwierigkeiten. Die meisten Programme sind "lernfähig"; der Anwender kann vorgeben, wie nicht erkannte Zeichen identifiziert werden sollen. Diese Vorgaben werden dann berücksichtigt.

Möchten Sie die Leistung eines OCR-Programms austesten, haben aber keinen Scanner, können Sie wie folgt vorgehen:

Schreiben Sie einen Text in Winword oder mit Notepad. Drücken Sie auf die Druck-Taste.

Starten Sie Ihr favorisiertes Grafikbearbeitungsprogramm und kopieren Sie den Inhalt des Zwischenspeichers in ein Bild. Speichern Sie dieses Bild als TIF- oder BMP-Datei ab.

Laden Sie sich die Software CuneiForm OCR 3.1 von der Internetseite www.xiazai.net und weisen Sie diesem Programm, nach Installation, die gespeicherte Bilddatei zu.

Handschriften können von OCR - Software i.d.R. nicht verarbeitet werden (Handschrifterkennung) .

Bei vielen handelsüblichen Scannern ist im beiliegenden Software-Paket auch eine OCR-Software enthalten.

Siehe auch Software zur Spracherkennung
Person(en):
Zeitraum:
Firma:
kein Eintrag vorhanden
- -
kein Eintrag vorhanden

Es gibt 46 weiterführende Erklärungen oder Definitionen:

Abschließen,   Analyse,   Anwender,   BMP,   Char,   Character,   Computer,   Datei,   Digital,   ELAN,   Gerät,   Grafik,   Handschrifterkennung,   HTML BeitragHTML,   HTTP,   iCal,   Installation,   laden,   Licht,   Notepad BeitragNotepad,   Paket,   Programm,   Quote BeitragQuote,   Rach,   Scanner BeitragScanner,   Schließen,   Schreiben,   Schrift,   Schriftart,   Schriftgröße,   Seite,   Software,   Speicher,   Sprache,   Spracherkennung,   Text,   Tile,   Topologie,   Vorlage,   WinWord,   Wörterbuch,   Word,   Zahl,   Zeichen,   Zeichenerkennung,   Zwischenspeicher 

Veröffentlicht am:
Zuletzt bearbeitet am:
Referenz:
15.04.2004 von Wilhelm Janssen (7094) Beiträge
09.10.2004 von Wilhelm Janssen
at-mix
Druckversion
Spacer
0|1|2|3|4|5|6|7|8|9|
A|B|C|D|E|F|G|H|I|J|
K|L|M|N|O|P|Q|R|S|T|
U|V|W|X|Y|Z|  -  :-) 
Dateiendungen
validome.org
Bei Validome können Sie Ihre Website auf barrierefreies HTML testen
 
nach oben