Startseite
Weiterbildung
Zertifikatskurse
Data Science
2 Statistische Grundlagen und KI-gestützte Datenanalyse

2 Statistische Grundlagen und KI-gestützte Datenanalyse

Studienziele Modul 2

Die Teilnehmenden wenden grundlegende Methoden der deskriptiven Statistik und der Wahrscheinlichkeitsrechnung an. Sie verstehen die Konzepte der bedingten Wahrscheinlichkeit und wenden das Theorem von Bayes auf praktische Fragestellungen an. Die Teilnehmenden kennen den Unterschied zwischen überwachtem und unüberwachtem Lernen und wenden Verfahren aus dem Data Mining – Assoziation, Klassifikation und Clusterung – kompetent an. Sie beurteilen Modelle anhand geeigneter Gütemaße und interpretieren Ergebnisse kritisch.

Die Teilnehmenden lernen kennen die Möglichkeiten und Grenzen der KI im Zusammenhang mit der Datenanalyse kennen und erhalten Wissen über algorithmische Verzerrung, Halluzinationen und regulatorische Rahmenbedingungen.

Technologisch steht R im Mittelpunkt. Die Teilnehmenden werden ermutigt, R-Programme mithilfe von KI-Werkzeugen in Python zu übersetzen und dabei die konzeptionelle Übertragbarkeit zu reflektieren.

Lehrinhalte

Statistisches Fundament:
- Datenorganisation und Häufigkeitsverteilungen, Exploration
- Kennwerte: Lage, Streuung, Form und Symmetrie
- Kontingenz und Korrelation
- Regression als Brücke zum Data Mining
- Wahrscheinlichkeitsrechnung: Grundlagen, Zufallsvariablen, Verteilungen, Bayes-Regel
Datentransformation:
- Normalisierung, Skalierung, z-Transformation
- Feature Selection und Feature Engineering
Data Mining – die Workhorses:
- Assoziationsanalysen und Interessantheitsmasse
- Klassifikation: Entscheidungsbäume, Modellbewertung, Konfusionsmatrix, ROC-Analyse
- Clusteranalysen: Ähnlichkeits- und Distanzmaße
KI in der Datenanalyse:
- Möglichkeiten und Risiken: Halluzinationen, Algorithmic Bias, falsches Konfidenzgefühl, Schmeichelei
- Regulatorischer Rahmen: EU AI Act aus der Anwenderperspektive

Lehr- und Lernmethoden

Problem based learning; Vorträge, problemorientierte Übungen und Aufgaben

Abschluss

Hochschulzertifikat der Berliner Hochschule für Technik
(bei Absolvierung der modulbegleitenden Aufgaben und der Modulprüfung; 5 Creditpoints nach ECTS);
ansonsten Teilnahmebescheinigung

Durchführung

Dauer: 8 Wochen
Beginn: 08. Januar 2027
Anmeldung: jederzeit zum nächsten Beginn
Präsenztermine:
08. Januar 2027 14:30 Uhr bis 09. Januar 16:00 Uhr
05. März 2027 14:30 Uhr bis 06. März 16:00 Uhr

Nutzungsentgelt

1.500,- Euro

Zugangsvoraussetzungen

Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA)
mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung
Vorkenntnisse in Statistik (Deskriptive Statistik, Wahrscheinlichkeitsrechnung) sind von Vorteil
Interesse an der Teilnahme durch berufliche Erfahrungen in einem der Themenfelder (Vorverarbeitung, Datenanalyse, Ergebniskommunikation).

Detaillierte Informationen

Aufbau und Ablauf des Fernstudienkurses

weiter zu Modul 3: Darstellung der Analyseergebnisse (Storytelling)

Studienkoordination und -entwicklung

Gabriele Gessler
030 4504 6015
gessler[at]bht-berlin.de

Anmeldung

Online-Anmeldung

Anmeldeschluss ist der 13. Dezember 2026.