OpenRefine for the Humanities
Die Lektion, die von Julia Tolksdorf und Robert Zwick entwickelt wurde, vermittelt grundlegende Kenntnisse zur Arbeit mit strukturierten Forschungs- und Kulturerbedaten. Anhand eines Teilbestands der Open-Access-Daten des Metropolitan Museum of Art lernen Teilnehmende, Datensätze zu importieren, zu explorieren, zu bereinigen und für die weitere Analyse vorzubereiten. Die Lektion behandelt zentrale Funktionen von OpenRefine wie Facetten und Filter, die Anwendung von GREL-Funktionen, die Transformation und Standardisierung von Daten sowie das Erkennen und Zusammenführen inkonsistenter Werte durch Clustering. Darüber hinaus führt sie in die Anreicherung von Daten durch den Abgleich mit externen Normdatenquellen ein und zeigt, wie Bearbeitungsschritte dokumentiert und als reproduzierbare Workflows gespeichert werden können. Nach der Bearbeitung der Lektion verfügen Lernende über praktische Erfahrungen im Umgang mit typischen Datenqualitätsproblemen und können OpenRefine für Forschungsaufgaben in den Geisteswissenschaften einsetzen.
Die Sprache der Lektion ist Englisch.
Die Lektion wurde vorab unter https://hermes-dkz.github.io/open-refine-humanities/ sowie auf Zenodo unter https://zenodo.org/records/20829942 veröffentlicht.
Hier eine Vorschau auf die Lektion: