Kompetenzstufe: Fortgeschrittene*r
Sprache: Englisch, Französisch
Format: Tutorial, Code
Medientyp: Bildmedien, Textmedien
Veröffentlichung: 25.11.2014
Modifizert am: 20.12.2024
ID:
® 10.46430/phen0036
Generating an Ordered Data Set from an OCR Text File
Jon Crump
Capturing
Converting
Parsing
Relational Analysis
Pattern Recognition
Analyzing
Data Recognition
Optical Character Recognition
Algorithmus
Programmierung
Data Literacy
This tutorial illustrates strategies for taking raw OCR output from a scanned text, parsing it to isolate and correct essential elements of metadata, and generating an ordered data set (a python dictionary) from it.
Diese Ressource steht unter folgender Lizenz: