Moduldetails
Datenjournalismus: Datenmodellierung
OR92

Dieses Modul gehört zum Studienschwerpunkt "Datenjournalismus" im Studiengang Online-Redaktion und wird angeboten im Studiengang Data and Information Science.

Workload Credits Studiensemester Frequenz Dauer
180h 6 7. Sem. jährlich 1 Sem.
1 Lehrveranstaltungen Kontaktzeit Selbststudium Sprache Gruppengröße
∑ 4 SWS / 60h ∑ 120h
OR92.1
Datenmodellierung (Seminaristischer Unterricht und Laborpraktikum)
OR92.1
4 SWS / 60h
OR92.1
120h
OR92.1
Deutsch
OR92.1
45
2 Lernergebnisse (learning outcomes / Kompetenzen):
OR92.1

(WAS) Die Studierenden lernen, Daten und Informationen, die in elektronischer Form vorliegen, aufzubereiten, zu strukturieren und in gängige Formate zu überführen.

(WOMIT) Hierzu setzen sie unterschiedliche Formate (z.B. CSV, XML oder JSON), automatisierte Transformationen (z.B. mit XSLT oder auf der Kommandozeile) und Editoren (z.B. Notepad++) ein.

(WOZU) Sie werden somit in die Lage versetzt, beliebige Quelldaten so aufzubereiten, dass diese für spätere Anwendungen, z.B. als Eingabe für Datenbank- und Retrievalsysteme oder für das Data Mining genutzt werden können. Sie kennen dabei typische Verfahren, Tools und Formate, um die Ergebnisse ihrer Aufbereitung und Modellierung flexibel einzusetzen. Des Weiteren können sie diese je nach Anwendungsfall und Anforderung anpassen.

3 Inhalte:
OR92.1

In dem Modul werden Verfahren, Tools und Formate zur Aufbereitung, Strukturierung und Transformation von beliebigen Daten und Informationen vorgestellt und deren praktischer Einsatz in Laborpraktika geübt. Im Fokus stehen die verschiedenen Schritte, die notwendig sind, um beliebige digitale Daten und Informationen in eine einheitliche Form zu bringen sowie eine strukturierte Weiterverarbeitung zu ermöglichen. Weiterhin werden Verfahren zur automatisierten Transformation von Daten (z.B. mit regulären Ausdrücken, XSLT oder kleiner Skripte) in diverse Formate (wie z.B. CSV, XML, JSON) unter Verwendung von Texteditoren (wie bspw. Notepad++) behandelt. Neben den theoretischen Grundlagen zu Datenstrukturen (Listen, Bäume, etc.) werden praktische Fähigkeiten in den unterschiedlichen Arten von Daten- und Informationsgewinnung aus dem Web (Datenbanken, Web-APIs, Scraping) und der Datenbereinigung (Konsistenzprüfung, Harmonisierung, etc) vermittelt. Hierzu werden eine Reihe von experimentellen (z.B. OXPath) sowie bereits im professionellen Einsatz befindliche Methoden und Tools vorgestellt und an praktischen Beispielen evaluiert.

4 Lehrformen:
Seminaristischer Unterricht und Laborpraktikum (OR92.1)
5 Teilnahmevoraussetzungen:

Formal: keine

Empfohlen: Kenntnisse des Moduls "Informationsarchitektur des Webs"

6 Art der Prüfung:
Klausur oder lehrveranstaltungsbegleitende Prüfung (OR92.1)
7 Voraussetzungen für die Vergabe von Kreditpunkten:
Bestehen der Modulprüfung
8 Art: Pflicht- oder Wahlmodul
Wahlmodul
9 Bewertungsmethoden benotet/unbenotet
unbenotet
10 Stellenwert der Note für die Endnote:
-
11 Modulbeauftragte/r und hauptamtlich Lehrende
Modulbeauftragte/r: Prof. Dr. Philipp Schaer
Hauptamtlich Lehrende: Prof. Dr. Tobias Galliat, Prof. Dr. Matthias Groß, Prof. Dr. Achim Oßwald, Prof. Dr. Philipp Schaer
12 Sonstige Informationen:
-
13 Literatur / Quellen
-