Moduldetails
Datenjournalismus: Data Mining
OR94

Dieses Modul gehört zum Studienschwerpunkt "Datenjournalismus" im Studiengang Online-Redaktion und wird angeboten im Studiengang Data and Information Science.

Workload Credits Studiensemester Frequenz Dauer
180h 6 6. Sem. jährlich 1 Sem.
1 Lehrveranstaltungen Kontaktzeit Selbststudium Sprache Gruppengröße
∑ 4 SWS / 60h ∑ 120h
OR94.1
Data Mining (Seminaristischer Unterricht und Laborpraktikum)
OR94.1
4 SWS / 60h
OR94.1
120h
OR94.1
Deutsch
OR94.1
45
2 Lernergebnisse (learning outcomes / Kompetenzen):
OR94.1

(WAS) Die Studierenden lernen, grundlegende Data Mining-Algorithmen für konkrete Fragestellungen und Datensammlungen auszuwählen, diese – unter Optimierung der frei wählbaren Parameter – anzuwenden und die Ergebnisse zu validieren.

(WOMIT) Hierzu erstellen sie Prozess-Streams unter Verwendung professioneller Data Mining Workbenches (wie z.B. RapidMiner, IBM SPSS Modeler), die den kompletten Workflow vom Zugriff auf die Datenquelle (Datenbanksystem, Dateien in unterschiedlichen Formaten) bis zur Ergebnisvisualisierung abbilden.

(WOZU) Ziel ist dabei die Generierung neuer Informationen, die für die Entscheidungsfindung und zum Aufbau von Empfehlungssystemen in Wissenschaft und Wirtschaft genutzt werden können.

3 Inhalte:
OR94.1
  • Klassifikationsverfahren (z.B. Entscheidungsbaumsysteme, Support Vector Machines)
  • Clusterverfahren (hierarchisch, k-means)
  • Verfahren zur Assoziationsanalyse
  • Kollaboratives Filtern
4 Lehrformen:
Seminaristischer Unterricht und Laborpraktikum (OR94.1)
5 Teilnahmevoraussetzungen:
keine
6 Art der Prüfung:
Klausur oder lehrveranstaltungsbegleitende Prüfung (OR94.1)
7 Voraussetzungen für die Vergabe von Kreditpunkten:
Bestehen der Modulprüfung
8 Art: Pflicht- oder Wahlmodul
Wahlmodul
9 Bewertungsmethoden benotet/unbenotet
unbenotet
10 Stellenwert der Note für die Endnote:
-
11 Modulbeauftragte/r und hauptamtlich Lehrende
Modulbeauftragte/r: Prof. Dr. Tobias Galliat
Hauptamtlich Lehrende: Prof. Dr. Tobias Galliat, Prof. Dr. Gernot Heisenberg
12 Sonstige Informationen:
-
13 Literatur / Quellen
  • Leskovec, Jure / Rajaramann, Anand / Ullmann, Jeff (2014): Mining of Massive Datasets, 2nd ed.
  • Liu, Bing (2011): Web Data Mining, Heidelberg, 2nd ed.