3313009 (SoSe 2024) - VL

Kurseinschreibung

Statistik und Data Science für die Informatik

Grundlagen der Statistik und Bezüge zu Data Science: Übersicht verschiedener Arten der Statistik (z.B. deskriptive Statistik, Inferenzstatistik, explorative Statistik) und Datentypen; motivierende Beispiele für Einsatz in Anwendungen; Daten und Ethik– Deskriptive Statistik und Wahrscheinlichkeitsverteilungen: (diskrete u. vor allem) kontinuierliche Verteilungen; grundlegende Konzepte für kontinuierliche Verteilungen (bedingte Wahrscheinlichkeit, stochastische Unabhängigkeit, Multiplikationssatz, Satz von Bayes, Erwartungswert, Varianz, Kovarianz usw.); Sampling, statistische Signifikanz und Tests; Bezug zu Data Science durch Umsetzen eines Beispielalgorithmus wie Naive Bayes Klassifikator
Inferenzstatistik: Stochastische Optimierung durch Gradientenabstieg und ihr Einsatz in Inferenzstatistik (z.B. SGD, künstliche Evolution); angewandte Differentialrechnung; Entscheidungsräume und Verlust-funktionen (z.B. mittlerer absoluter Fehler, mittlere quadratische Abweichung, Hinge Loss, Negative Log Likelihood); Lineare Transformationen (Einbettungen von Datenpunkten in Vektorräumen); Regularisierungstechniken (z.B. Dropout, Mini-Batching, L1/L2-Regularisierung); statistische Gütekriterien (wie F-Maß, Korrektklassifikationsrate); Validierungsverfahren (z.B. Kreuzvalidierung); Ausblick auf vertiefende Themen (z.B. Multi-Class/Multi-Label, Regression, dynamische Daten); Bezug zu Data Science durch Um-setzen eines Beispielalgorithmus wie z.B. eines flachen Neuronalen Netzes zur Klassifikation
Informationstheorie: Übersicht über für Statistik und Data Science relevante Grundbegriffe und Kenntnisse (z.B. Entropie, Kullback-Leibler-Divergenz, Kreuzentropie, Mutual Information, Differentielle Entropie); Bezug zu Data Science durch Verwendung in einem Beispielalgorithmus wie z.B. der Induktion von Entscheidungsbäumen
Explorative Statistik: Ähnlichkeitsmaße (z.B. Kosinus-Ähnlichkeit, Euklidischer Abstand); Datentransformation (z.B. Diskretisierung, Normalisierung); Datenvisualisierung (z.B. Balkendiagramme, Box-Plots, Scatter-Plots, PCA); Intrinsische und extrinsische Gütekriterien; Bezug zu Data Science durch Umsetzen eines Beispielalgorithmus wie z.B. Clustering mit k-means

Kursverantwortliche/r: Anke-Bilke Bianchi
Kursverantwortliche/r: Arik Ermshaus
Kursverantwortliche/r: Syeda Khair Un Nisa
Kursverantwortliche/r: Ulf Leser
Kursverantwortliche/r: Henrik Scheeff
Kursverantwortliche/r: Hermann Stolte

Semester: SoSe 2024

Kurseinschreibung

Statistik und Data Science für die Informatik

Selbsteinschreibung (Teilnehmer/in)