Data Science
Zertifikatskurs Data Science - from messy data to clear insights
Daten sind zu einem betrieblichen Rohstoff eigener Art geworden. Laut Hal Varian, Chief Economist bei Google Inc., setzt sich die Wertschöpfungskette der Daten aus Zugriff, Verständnis, Verarbeitung, Analyse und Ergebniskommunikation zusammen. Diese Aussage ist unsere Mission, die wir in unseren Modulen konsequent umsetzen.
"Das bisher nicht gekannte und sich immer stärker beschleunigende Wachstum digitaler Daten durchdringt einzelne Produktionsvorgänge ebenso wie ganze Unternehmungen, Organisationen und wissenschaftliche Projekte. Neben klassischen Transaktionsdaten fallen Daten aus der Logistik (RFID, GIS), Social Media, dem Internet der Dinge und aus öffentlichen Angeboten (Open Data) in immer größerer Menge und Vielfalt an. Die effektive Auswertung dieser Datenmengen erfordert von Beschäftigten aller Branchen völlig neue Qualifikationen."
Data Science wird durch die aktuellen Entwicklungen der Künstlichen Intelligenz aufgewertet. Gerade für Nicht-Fachleute, also Personen, die weder Informatik noch Mathematik/Statistik noch Physik studiert haben, werden Kenntnisse in Data Science zu einer wichtigen Voraussetzung für die effiziente Nutzung von KI, denn: Data Science bildet die Verbindung zwischen menschlicher und künstlicher Intelligenz.Hierzu sagt ChatGPT Folgendes.
Um die Teilnehmenden für diese neuen Herausforderungen fit zu machen, vereinigt der Weiterbildungskurs „Data Science" Fachwissen aus der Informatik mit quantitativen Methoden und Aspekten des Informations- und Kommunikationsdesigns. Dabei wird in drei Schritten vorgegangen:
- Daten: vom Zugriff bis zur Bereitstellung "gereinigter" analysierbarer Datensätze
- Methoden: von elementarer Statistik bis zum maschinellen Lernen
- Kommunikation: unverzerrte und visuelle Ergebnisdarstellung
Dabei wird mit R und Python gearbeitet und die effektive Nutzung der Business Intelligence Werkzeuge Power Query und Power View entlang der Wertschöpfungskette gezeigt. Auch auf Azure Machine Learning wird mit konkreten Beispielen Bezug genommen.
Lehrinhalte
Der Zertifikatskurs "Data Science / Statistical Learning" umfasst folgende Module, die einzeln buchbar sind:
- Modul 1: Datenvorverarbeitung (Data Preparation and Wrangling) umfasst die Schritte Datenzugriff, Datenverständnis und Datenaufbereitung mit dem Ziel der Vorbereitung auswertungsbereiter Datensätze.
- Modul 2: Quantitative Methoden und Data Mining vermittelt die Grundlagen der Datenanalyse. Wir stellen wichtige Algorithmen des überwachten maschinellen Lernens (supervised Learning) wie des unüberwachten maschinellen Lernens (unsupervised Learning) detailliert und auf der Grundlage praxisnaher Beispiele vor. Konkret werden Neuronale Netze, Lineare Regression, Clustering und Entscheidungsbäume im Detail behandelt. Gezeigt werden auch konkrete Anwendungen in Data Mining und Business Intelligence.
- Modul 3: Darstellung der Analyseergebnisse (Storytelling) thematisiert die entscheidungsorientierte Darstellung von Handlungsmöglichkeiten in verständlichen „Geschichten“, integriert in Texten, Tabellen, Grafiken und thematischen Karten.
-
Sehen Sie hier, wie die Module aufeinander aufbauen.
Wissenschaftliche Leitung
Dr. Peter Lauf: Diplom und Promotion in Volkswirtschaft mit Schwerpunkt in quantifizierender Wirtschafts- und Sozialgeschichte an der Universität zu Köln. Datenanalytiker, Marketingleiter, Leiter Database und Manager Big Data bei Startups und in den verschiedensten Branchen. 12 Jahre Erfahrung mit R, 20 Jahre Erfahrung mit SPSS, zertifizierter SAS Programmierer. Lehraufträge an Universitäten und Fachhochschulen zu Statistik, Datenmanagement und Datenbanken. Vertretung einer Professur für Quantitative Methoden und Data Mining im Fachbereich Wirtschaftsinformatik der HTW Berlin. Bis Wintersemester 2020/21 Professor für Business Information Systems an der Digital Business University (DBU) in Berlin, gegenwärtig Lehrbeauftragter an der Hochschule für Technik und Wirtschaft Berlin.
Zielgruppe / Teilnahmevoraussetzungen
Data Science / Statistical Learning ist nicht an eine bestimmte Branche gebunden. Der Kurs richtet sich an alle, die bereits jetzt mit Datenanalysen befasst sind, also insbesondere an Ökonom/en/innen, Ingenieur/e/innen und Informatiker/innen, aber auch Soziolog/en/innen können von dem Kurs profitieren.
Teilnahmevoraussetzung ist der Abschluss eines Hochschulstudiums oder eines vergleichbaren Studiums an einer Berufsakademie (BA) sowie mindestens ein Jahr für die Weiterbildung geeignete Berufserfahrung; außerdem wünschen wir uns ein (kurzes) Motivationsschreiben, um die Kursinhalte optimal auf die Bedürfnisse unserer Teilnehmenden auszurichten. Erste Erfahrungsberichte von Absolvent*innen finden Sie hier.
Besondere Vorkenntnisse im Programmieren mit R und Python sind nicht erforderlich, wir freuen uns jedoch über Offenheit gegenüber neuen Methoden, Werkzeugen und Fragestellungen.
Abschluss
Hochschulzertifikat „Data Scientist“ der Berliner Hochschule für Technik nach erfolgreichem Bestehen aller Modulleistungen (Module 1 bis 3).
Die Teilnahme an einzelnen Modulen wird nach erfolgreichem Bestehen der Modulleistung mit dem Modultitel zertifiziert.
Durchführung
Der nächste Kurs startet im Oktober 2025. Die genauen Termine werden in Kürze veröffentlicht.
Dauer/Termine: 8 Wochen: Oktober bis Dezember (Modul 1)
8 Wochen: Januar bis März (Modul 2)
8 Wochen: April bis Juni (Modul 3)
Anmeldung: bis zum 31. Juli für das Wintersemester 2025/26 (gerne auch noch nach diesem Termin nachfragen)
Präsenztermine*): jeweils 2 Tage zu Beginn und am Ende eines Moduls
Hier finden Sie detaillierte Informationen zum Aufbau und Ablauf des Fernstudienkurses.
Nutzungsentgelt
1.500,- Euro pro Modul