Moduldetails
Datenmodellierung
DIS08

Dieses Modul ist auch Bestandteil des Schwerpunktes "Datenjournalismus" im Studiengang OR.

Workload Credits Studiensemester Frequenz Dauer
180h 6 3. Sem. jährlich 1 Sem.
1 Lehrveranstaltungen Kontaktzeit Selbststudium Sprache Gruppengröße
∑ 4 SWS / 60h ∑ 120h
DIS08.1
Datenmodellierung (Seminaristischer Unterricht und Laborpraktikum)
DIS08.1
4 SWS / 60h
DIS08.1
120h
DIS08.1
Deutsch
DIS08.1
45
2 Lernergebnisse (learning outcomes / Kompetenzen):
DIS08.1

(WAS) Die Studierenden lernen, Daten und Informationen, die in elektronischer Form vorliegen, aufzubereiten, zu strukturieren und in gängige Formate zu überführen.

(WOMIT) Hierzu setzen sie unterschiedliche Formate (z.B. CSV, XML oder JSON), automatisierte Transformationen (z.B. mit XSLT oder auf der Kommandozeile) und Editoren (z.B. Notepad++) ein.

(WOZU) Sie werden somit in die Lage versetzt, beliebige Quelldaten so aufzubereiten, dass diese für spätere Anwendungen, z.B. als Eingabe für Datenbank- und Retrievalsysteme oder für das Data Mining genutzt werden können. Sie kennen dabei typische Verfahren, Tools und Formate, um die Ergebnisse ihrer Aufbereitung und Modellierung flexibel einzusetzen. Des Weiteren können sie diese je nach Anwendungsfall und Anforderung anpassen.

3 Inhalte:
DIS08.1

In dem Modul werden Verfahren, Tools und Formate zur Aufbereitung, Strukturierung und Transformation von beliebigen Daten und Informationen vorgestellt und deren praktischer Einsatz in Laborpraktika geübt. Im Fokus stehen die verschiedenen Schritte, die notwendig sind, um beliebige digitale Daten und Informationen in eine einheitliche Form zu bringen sowie eine strukturierte Weiterverarbeitung zu ermöglichen. Weiterhin werden Verfahren zur automatisierten Transformation von Daten (z.B. mit regulären Ausdrücken, XSLT oder kleiner Skripte) in diverse Formate (wie z.B. CSV, XML, JSON) unter Verwendung von Texteditoren (wie bspw. Notepad++) behandelt. Neben den theoretischen Grundlagen zu Datenstrukturen (Listen, Bäume, etc.) werden praktische Fähigkeiten in den unterschiedlichen Arten von Daten- und Informationsgewinnung aus dem Web (Datenbanken, Web-APIs, Scraping) und der Datenbereinigung (Konsistenzprüfung, Harmonisierung, etc) vermittelt. Hierzu werden eine Reihe von experimentellen (z.B. OXPath) sowie bereits im professionellen Einsatz befindliche Methoden und Tools vorgestellt und an praktischen Beispielen evaluiert.

4 Lehrformen:
Seminaristischer Unterricht und Laborpraktikum (DIS08.1)
5 Teilnahmevoraussetzungen:

inhaltlich: Webprogrammierung

formal: keine

6 Art der Prüfung:
Schriftliche Ausarbeitungen (Einzel und Gruppen), (Zwischen-)Klausur oder mündliche Prüfung (DIS08.1)
7 Voraussetzungen für die Vergabe von Kreditpunkten:
Bestandene Modulprüfung
8 Art: Pflicht- oder Wahlmodul
Pflichtmodul
9 Bewertungsmethoden benotet/unbenotet
benotet
10 Stellenwert der Note für die Endnote:
3%
11 Modulbeauftragte/r und hauptamtlich Lehrende
Modulbeauftragte/r: Prof. Dr. Philipp Schaer
Hauptamtlich Lehrende: Prof. Dr. Tobias Galliat, Prof. Dr. Matthias Groß, Prof. Dr. Philipp Schaer
12 Sonstige Informationen:
-
13 Literatur / Quellen
-