Modulbeschreibung MA4802

Modulbeschreibung

MA4802: Statistisches Lernen

Fakultät für Mathematik

Modulniveau:
Master
Sprache:
Englisch
Semesterdauer:
Einsemestrig
Häufigkeit:
Sommersemester
Credits*:
6
Gesamt-
stunden:

180
Eigenstudiums-
stunden:

120
Präsenz-
stunden:

60
* Die Zahl der Credits kann in Einzelfällen studiengangsspezifisch variieren. Es gilt der im Transcript of Records oder Leistungsnachweis ausgewiesene Wert.
Beschreibung der Studien-/Prüfungsleistungen:
Aktueller Hinweis angesichts des eingeschränkten Präsenzbetriebs auf Grund der CoViD19-Pandemie: Die Prüfungsform ändert sich gemäß §13a APSO auf das Prüfungsformat: einmalige Übungsleistung.
In dieser soll das Verständnis der Studierenden von Definitionen, wesentlichen Hilfsmitteln und Ergebnissen des statistischen Lernens überprüft werden. Von den Studierenden wird erwartet, dass sie die Methoden herleiten, ihre Eigenschaften erklären und sie auf spezifische Beispiele anwenden können. Darüberhinaus können sie Lernalgorithmen für neue Modelle entwickeln, basierend auf der gemeinsamen probabilistischen Formulierung von statistischen Lernproblemen.
Wiederholungsmöglichkeit:
Im Folgesemester: keine Angabe
Am Semesterende: Ja
(Empfohlene) Voraussetzungen:
MA2402 Grundlagen: Statistik. Empfohlen: MA4401 Angewandte Regression, ausreichende praktische Kenntnisse statistischer Software, MA3402 Rechnergestützte Statistik
Angestrebte Lernergebnisse:
Nach erfolgreichem Abschluss des Moduls sind die Studierenden in der Lage, die Konzepte und Methoden des überwachten und unüberwachten statistischen Lernen zu verstehen und auf grosse Daten anzuwenden. Sie werden grundliegende Prinzipien des statistischen Machine Learning mit Fokus auf der probabilistischen Formulierung der Lernprobleme verstanden haben. Darüberhinaus können sie neue Algorithmen für neue Modelle entwerfen und neue Daten damit analysieren.
Inhalt:
Einführung
- statistisches Lernen, überwacht/unüberwacht
- Bewertung der Modellgenauigkeit, Bias-Varianz Trade-off
Überwachtes Lernen
- Hochdimensionale Regression & Shrinkage Verfahren
- Lineare Klassifikation, Logistische Regression
- Resampling: Cross Validation, Bootstrap
- Nichtlineare Klassifikation, Decision Trees und Random Forests
Unüberwachtes Lernen
- Dimensionsreduktion, Hauptkomponentenanalyse
- Clustering, Mischmodelle
- Graphische Modelle
Lehr- und Lernmethode:
Das Modul besteht aus einer Vorlesung und einer begleitenden Übungsveranstaltung. In der Vorlesung werden mit Hilfe der Inhalte die entsprechenden Kompetenzen durch Vortrag und Diskussion vermittelt. Studierende sollen dabei zum Studium der Literatur und der inhaltlichen Auseinandersetzung mit den Themen angeregt werden. Die Kompetenzen werden anschließend in der Übung an Fallbeispielen oder Aufgaben erst angeleitet im Laufe des Semesters immer mehr selbstständig einzeln zum Teil auch in Kleingruppen geübt und erworben.
Medienformen:
Die folgenden Medien werden verwendet:
- Tafel
- Folien
Literatur:
Grundlagen:
• Hastie, T., Tibshirani, R., and Friedman, J. (2013). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics. Springer New York.
• James, G., Witten, D., Hastie, T., and Tibshirani, R. (2013). An Introduction to Statistical Learning: with Applications in R. Springer Texts in Statistics. Springer New York.
• Murphy, K. (2012). Machine Learning: A Probabilistic Perspective. MIT Press.

Optional:
• Berk, R. (2008). Statistical Learning from a Regression Perspective. Springer Series in Statistics. Springer.
• Cowell, R., Dawid, P., Lauritzen, S., and Spiegelhalter, D. (2007). Probabilistic Networks and Expert Systems: Exact Computational Methods for Bayesian Networks. Information Science and Statistics. Springer.• Lauritzen, S. (1996). Graphical Models. Clarendon Press.
• Nagarajan, R., Scutari, M., and Le`bre, S. (2013). Bayesian Networks in R: with Applications in Systems Biology. Use R! Springer.
• Scutari, M. and Denis, J. (2014). Bayesian Networks: With Examples in R. Chapman & Hall/CRC Texts in Statistical Science. Taylor & Francis.
Modulverantwortliche(r):
Theis, Fabian; Prof. Dr.: theis@mytum.de
Lehrveranstaltungen (Lehrform, SWS) Dozent(in):

0000004897 Exercises for Statistical Learning [MA4802] (2SWS UE, SS 2020/21)
Marr C, Peng T, Theis F

0000004901 Statistical Learning [MA4802] (2SWS VO, SS 2020/21)
Marr C, Peng T, Theis F