Moduldetails
Big Data
DIS21a

Dieses Modul ist der Studienrichtung Data Analyst zugeordnet.

Workload Credits Studiensemester Frequenz Dauer
180h 6 5. Sem. jährlich 1 Sem.
1 Lehrveranstaltungen Kontaktzeit Selbststudium Sprache Gruppengröße
∑ 4 SWS / 60h ∑ 120h
DIS21a.1
Big Data (Seminaristischer Unterricht und Laborpraktikum)
DIS21a.1
4 SWS / 60h
DIS21a.1
120h
DIS21a.1
Deutsch / Englisch
DIS21a.1
45
2 Lernergebnisse (learning outcomes / Kompetenzen):
DIS21a.1

In der Lehrveranstaltung werden Grundlagen und Techniken zur Auswertung großer Datenmengen mittels Neuronaler Netze vermittelt. Diese Daten lassen sich neben ihrer Größe durch vier weitere Merkmale charakterisieren: hohe Variabilität, stetiger und massiver Zuwachs und hohe Komplexität. Die zur Analyse notwendigen Techniken und Methoden, bekommen die Studierenden in diesem Modul vermittelt. Die Learning Outcomes sind wie folgt:

(WAS) Die Studierenden werden fachlich in die Lage versetzt die Charakteristika, Potenziale und Risiken von Big Data zu verstehen und abzuschätzen und eine systematische Planung und Umsetzung der Analyse von Massendaten unter spezifischen wirtschaftlichen wie wissenschaftlichen Fragestellungen vorzunehmen,

(WOMIT) indem sie Daten mit Python vorverarbeiten, säubern und transformieren können, darüber hinaus Analysemethoden wie Neuronale Netze und Deep Learning verstehen, anwenden und optimieren und reale, große Datensätzen analysieren, Ergebnisse visualisieren und interpretieren sowie berichten können,

(WOZU) um mit den aus umfangreichen Analysen und Ergebnismodellen gewonnenen Erkenntnissen Handlungsempfehlungen und Entscheidungen abzuleiten und für die Wissenschaft und Wirtschaft aufzubereiten.

3 Inhalte:
DIS21a.1
  • Grundlagen
    • Einfache Neuronale Netze
    • Tensoren und Tensoroperationen
    • Stochastic Gradient Descent
    • Back propagation
    • Feed forward Netze
    • Deep Learning Ansätze
  • Ansätze
    • Convolutional und Recurrent Neural Networks (CNN & RNN)
    • Training, Testing und Validierung (Kreuzvalidierung)
    • Deployment
    • Over-/Underfitting: L2-Regularisierung und Dropout
  • Praxis
    • Jupyter Notebooks (Python) Grundlagen für Umsetzung mit Tensorflow und Keras in Google Colab
    • Anwendungsbeispiele aus den Bereichen
      • Computer Vision
      • Textanalyse und Word Embeddings
      • Sequenzanalyse
4 Lehrformen:
Seminaristischer Unterricht und Laborpraktikum (DIS21a.1)
5 Teilnahmevoraussetzungen:

Formal: keine

Empfohlen: Kenntnisse des Moduls 14 (Data Mining) und Moduls 23a (Market & Business Intelligence)

6 Art der Prüfung:
Klausur oder Projektarbeit oder Präsentation (DIS21a.1)
7 Voraussetzungen für die Vergabe von Kreditpunkten:
Bestandene Modulprüfung
8 Art: Pflicht- oder Wahlmodul
Wahlpflichtmodul
9 Bewertungsmethoden benotet/unbenotet
benotet
10 Stellenwert der Note für die Endnote:
4%
11 Modulbeauftragte/r und hauptamtlich Lehrende
Modulbeauftragte/r: Prof. Dr. Gernot Heisenberg
Hauptamtlich Lehrende: Prof. Dr. Gernot Heisenberg, Prof. Dr. Tobias Galliat
12 Sonstige Informationen:
-
13 Literatur / Quellen
  • O'Neil, Schutt: Doing Data Science, O‘Reilly 2013
  • Agneeswaran: Big Data Analytics beyond Hadoop, Pearson 2014
  • Provost, Fawcett: Data Science for Business, O'Reilly 2013
  • Ellis: Real-Time Analytics, Wiley 2014
  • Brauer, Hampe, Edlich, Friedland, Brückner: NoSQL: Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken, Carl Hanser Verlag, 2. Auflage. 2011
  • Plattner, Zeier: In-Memory Data Management: Technology and Applications, Springer Verlag, 2. Auflage, 2012
  • Aktuelle Forschungspapiere
  • Markus Hofmann, Ralf Klinkenberg, RapidMiner: Data Mining Use Cases and Business Analytics Applications, Chapman & Hall/CRC Data Mining and Knowledge Discovery Series, 2013
  • Vijay Kotu, Bala Deshpande, Predictive Analytics and Data Mining: Concepts and Practice with RapidMiner, Morgan Kaufmann, ISBN: 978-0128014608, 2014
  • Andrew Chisholm, Exploring Data with RapidMiner, PACKT Publishing, ISBN: 978-1782169338, 2013
  • Matthew North, Data Mining for the masses, Global Text Project, ISBN: 978-0615684376, 2012