Moduldetails
Natural Language Processing
DIS25a

Dieses Modul ist der Studienrichtung Data Analyst zugeordnet.

Workload Credits Studiensemester Frequenz Dauer
180h 6 6. Sem. jährlich 1 Sem.
1 Lehrveranstaltungen Kontaktzeit Selbststudium Sprache Gruppengröße
∑ 4 SWS / 60h ∑ 120h
DIS25a.1
Natural Language Processing (Seminaristischer Unterricht)
DIS25a.1
4 SWS / 60h
DIS25a.1
120h
DIS25a.1
Deutsch
DIS25a.1
45
2 Lernergebnisse (learning outcomes / Kompetenzen):
DIS25a.1

(WAS) Die Studierenden erlernen Methoden und Techniken zur maschinellen Verarbeitung von natürlicher Sprache. Hiermit werden Sie in die Lage versetzt auch große und unstrukturierte Textmengen so zu verarbeiten, dass diese analysiert, strukturiert und formal repräsentiert werden können.

(WOMIT) Im Mittelpunkt der Veranstaltung steht daher Verfahren des Part-of-Speech-Tagging, des syntaktischen und statistischen Parsing, der formalen Wissensrepräsentation und der Informationsextraktion. Die Verfahren werden sowohl theoretisch vorgestellt als auch praktisch in Form von Laborpraktika angewendet und so die Kenntnis über die Funktionsweise und die Möglichkeiten vertieft.

(WOFÜR) Nach Abschluss der Veranstaltung sind die Studierenden in der Lage, die kennengelernten Methoden und Techniken auf beliebige andere Daten und Anwendungsfälle zu übertragen (z.B. zur Analyse von Volltexten von Büchern, Artikeln, Internetforen oder anderen digital vorliegenden Quellen).

3 Inhalte:
DIS25a.1

Die theoretischen Inhalte der Veranstaltung beinhalten u.a. die Themen Sprache und Bedeutung, Morphologie, Syntax vs. Semantik. Darauf aufbauend werden Verfahren und Methoden des Part-of-Speech-Tagging, der Gegensatz von syntaktischem und statistischem Parsing und zur formale Wissensrepräsentation vorgestellt. Diese Grundlagen werden dann zum Themenkomplex semantische Technologien, die u.a. Verfahren des automatischen Indexierens, des maschinellen Lernens, statistischer Sprachmodelle oder auch Topic Modellierung beinhalten können.  Im Laborpraktikum werden verschiedene Ansätze der natürlichen Sprachverarbeitung praktisch durchgeführt, um so das Verständnis über die Methoden, deren Vorteile aber auch Beschränkungen kennenzulernen. Hierbei sollen einige ausgewählte Verfahren mit Hilfe von vorgegebenen Dokumentenkollektionen verarbeitet und die angewendeten Verfahren evaluiert werden. Die erzielten Ergebnisse werden analysiert und miteinander verglichen und im Beziehung gesetzt.

4 Lehrformen:
Seminaristischer Unterricht (DIS25a.1)
5 Teilnahmevoraussetzungen:

Keine Teilnahmevoraussetzungen

6 Art der Prüfung:
LV-begl.Präsentation und Hausarbeit (DIS25a.1)
7 Voraussetzungen für die Vergabe von Kreditpunkten:
Bestandene Modulprüfung
8 Art: Pflicht- oder Wahlmodul
Wahlpflichtmodul
9 Bewertungsmethoden benotet/unbenotet
benotet
10 Stellenwert der Note für die Endnote:
4%
11 Modulbeauftragte/r und hauptamtlich Lehrende
Modulbeauftragte/r: Prof. Dr. Klaus Lepsky
Hauptamtlich Lehrende: Prof. Dr. Klaus Lepsky, Prof. Dr. Philipp Schaer
12 Sonstige Informationen:
-
13 Literatur / Quellen
-