SkarpSkarp
Einstieg in Machine Learning: Grundlagen verständlich erklärt
💻 TechnologyBeginner1h 30m7 modules

Einstieg in Machine Learning: Grundlagen verständlich erklärt

In diesem Kurs lernst du die grundlegenden Ideen und Begriffe des Machine Learning kennen – ganz ohne Vorwissen in KI. Du verstehst, was Machine Learning ist, welche Arten von Lernverfahren es gibt und wie ein typischer ML‑Prozess aussieht, inklusive Daten, Modellen und Evaluation.

by leode

Course Content

7 modules · 1h 30m total

1

Was ist Machine Learning? Ein intuitiver Einstieg

Dieses Modul erklärt, was Machine Learning ist, warum es heute so wichtig ist und wie es sich von klassischer Programmierung unterscheidet – mit vielen anschaulichen Alltagsbeispielen.

15 min
2

Arten von Machine Learning: Überwacht, unüberwacht, bestärkend

In diesem Modul lernst du die drei grundlegenden Paradigmen des Machine Learning kennen und verstehst, welche Art sich für welche Aufgabe eignet.

15 min
3

Daten als Treibstoff: Features, Labels und Datensätze

Dieses Modul behandelt die Rolle von Daten im Machine Learning: Welche Arten von Daten gibt es, was sind Features und Labels, und wie werden Datensätze aufgeteilt?

15 min
4

Vom Problem zum Modell: Ein typischer Machine‑Learning‑Workflow

In diesem Modul lernst du den typischen Ablauf eines ML‑Projekts kennen – von der Problemformulierung über die Datenaufbereitung bis zur Modellbewertung.

15 min
5

Einfache Modelltypen: Lineare Modelle und Entscheidungsbäume

Dieses Modul stellt zwei intuitive Modellfamilien vor – lineare Modelle und Entscheidungsbäume – und erklärt ihre Grundidee ohne komplizierte Mathematik.

15 min
6

Gute vs. schlechte Modelle: Overfitting, Underfitting und Evaluation

In diesem Modul lernst du, wie man beurteilt, ob ein Modell gut ist, und was Begriffe wie Overfitting und Underfitting bedeuten – inklusive grundlegender Kennzahlen.

15 min
7

Machine Learning in der Praxis: Anwendungen, Chancen und Risiken

Dieses Modul gibt einen Überblick über aktuelle Anwendungsfelder von ML, beleuchtet Chancen und Risiken und führt in Themen wie Bias, Fairness und Datenschutz ein.

15 min

Read the Textbook

Read every chapter for free, right here in your browser.

Stell dir den heutigen Tag vor: Dein Musik‑ oder Video‑Streamingdienst schlägt dir neue Songs oder Serien vor. Dein E‑Mail‑Postfach sortiert Spam automatisch aus. Dein Smartphone entsperrt sich per Gesichtserkennung. Navigations‑Apps schlagen dir die „schnellste Route“ vor – abhängig vom aktuellen Verkehr.

Hinter all dem steckt Machine Learning (ML).

Merke (intuitiv): Machine Learning ist eine Methode, mit der Computer aus Beispielen lernen, anstatt jede Entscheidung Schritt für Schritt von Menschen vorgegeben zu bekommen.

Study Flashcards

Key concepts from this course as flashcard pairs.

Was ist Machine Learning? Ein intuitiver Einstieg

Machine Learning (ML)

Teilgebiet der Künstlichen Intelligenz, bei dem Computer aus Daten Muster und Zusammenhänge lernen, um Vorhersagen oder Entscheidungen zu treffen, ohne dass alle Regeln explizit von Menschen programmiert werden.

Klassische Programmierung

Programmierung, bei der Entwickler:innen die Regeln und Abläufe explizit festlegen (z. B. mit if-else-Anweisungen), ohne dass das Programm selbstständig aus Beispieldaten lernt.

Daten (im Kontext von ML)

Beispiele oder Messwerte aus der Vergangenheit (z. B. Bilder, Texte, Zahlen, Klicks), aus denen ein ML-Modell Muster lernen kann.

Modell

Mathematische oder statistische Struktur im Machine Learning, die versucht, einen Zusammenhang zwischen Eingaben (z. B. Bild, Text, Messwert) und Ausgaben (z. B. Klasse, Vorhersage) abzubilden.

Trainingsdaten

Teil der Daten, der verwendet wird, um ein ML-Modell zu trainieren, also seine Parameter so anzupassen, dass es möglichst gute Vorhersagen macht.

Arten von Machine Learning: Überwacht, unüberwacht, bestärkend

Überwachtes Lernen (Supervised Learning)

Lernart, bei der das Modell aus **Eingaben mit bekannten Ausgaben (Labels)** lernt. Typische Aufgaben: **Klassifikation** (Kategorien vorhersagen) und **Regression** (numerische Werte vorhersagen).

Unüberwachtes Lernen (Unsupervised Learning)

Lernart, bei der das Modell **keine Labels** bekommt und selbst **Strukturen oder Muster** in den Daten finden soll. Typische Aufgaben: **Clustering**, **Dimensionsreduktion**.

Bestärkendes Lernen (Reinforcement Learning)

Lernart, bei der ein **Agent** durch Interaktion mit einer **Umgebung** lernt und **Rewards** (Belohnungen/Bestrafungen) erhält. Ziel ist, eine Strategie zu lernen, die den **Gesamt-Reward** maximiert.

Label

Die **Zielinformation** in überwachten Lernproblemen (z. B. „Hund“ vs. „Katze“, Preis in Euro). Labels dienen als **richtige Antworten** beim Training.

Reward

Numerische **Rückmeldung** im bestärkenden Lernen, die anzeigt, wie gut eine Aktion in einem bestimmten Zustand war (z. B. +1 für Sieg, −1 für Niederlage).

Klassifikation

Aufgabe im überwachten Lernen, bei der eine Eingabe einer von mehreren **Kategorien** zugeordnet wird (z. B. Spam/Nicht-Spam, positiv/neutral/negativ).

+1 more flashcards

Daten als Treibstoff: Features, Labels und Datensätze

Rohdaten

Unverarbeitete, ursprüngliche Daten, so wie sie anfallen (z. B. Log-Dateien, Freitext, Sensordaten), noch nicht in eine Form gebracht, die ein ML-Modell direkt nutzen kann.

Feature (Merkmal)

Eine aufbereitete, strukturierte Eingabegröße für ein ML-Modell (oft Zahl oder klar definierte Kategorie), die wichtige Informationen über ein Objekt oder Beispiel enthält.

Label / Zielvariable

Die Größe, die ein überwacht lernendes Modell vorhersagen soll, z. B. Hauspreis, Spam/Nicht-Spam, Wird der Kurs bestanden (Ja/Nein).

Trainingsdaten

Datenteil, mit dem das Modell seine Parameter anpasst und lernt. Das Modell sieht diese Beispiele während des Lernprozesses immer wieder.

Validierungsdaten

Datenteil, mit dem Modellvarianten und Hyperparameter ausgewählt werden. Das Modell lernt nicht direkt daran, sondern wird damit verglichen und abgestimmt.

Testdaten

Datenteil, der erst ganz am Ende verwendet wird, um die echte Leistungsfähigkeit des finalen Modells auf bisher ungesehenen Beispielen zu messen.

+2 more flashcards

Vom Problem zum Modell: Ein typischer Machine‑Learning‑Workflow

Klassifikation

Überwachtes Lernproblem, bei dem das Modell Beispiele in **diskrete Klassen** einordnet (z. B. Spam vs. kein Spam).

Regression

Überwachtes Lernproblem, bei dem das Modell **kontinuierliche Zahlenwerte** vorhersagt (z. B. Preis, Temperatur).

Preprocessing

Schritt der **Datenaufbereitung**: Daten aufräumen, fehlende Werte behandeln, Formate vereinheitlichen, Texte in Zahlen umwandeln.

Feature Engineering

Aus Rohdaten sinnvolle **Eingangsgrößen (Features)** erstellen, mit denen das Modell Muster besser erkennen kann.

Training

Anpassen der **Modellparameter** anhand der Trainingsdaten, um den Fehler (Loss) zu minimieren.

Validierungsdaten

Datensatz, der **nicht** zum Training genutzt wird, sondern zur Auswahl von Modellen und Hyperparametern und zur Erkennung von Overfitting.

+2 more flashcards

Einfache Modelltypen: Lineare Modelle und Entscheidungsbäume

Lineares Modell (intuitive Definition)

Ein Modell, das eine Vorhersage als gewichtete Summe von Features plus einem Grundwert berechnet. Jedes Feature hat ein Gewicht, das den Einfluss auf die Vorhersage beschreibt.

Gewicht (Koeffizient)

Eine Zahl in einem linearen Modell, die angibt, wie stark ein Feature die Vorhersage erhöht oder senkt. Positives Gewicht: erhöht die Vorhersage, negatives Gewicht: senkt sie.

Bias / Achsenabschnitt

Der Grundwert in einem linearen Modell – die Vorhersage, wenn alle Features den Wert 0 hätten.

Entscheidungsbaum

Ein Modell, das Vorhersagen trifft, indem es eine Folge von Ja/Nein-Fragen (auf Basis von Features und Schwellenwerten) stellt und am Ende eine Entscheidung in einem Blattknoten ausgibt.

Overfitting (Überanpassung) bei Bäumen

Wenn ein Entscheidungsbaum die Trainingsdaten zu genau auswendig lernt und dadurch auf neuen Daten schlechtere Vorhersagen macht.

Interpretierbarkeit

Wie gut Menschen nachvollziehen können, warum ein Modell eine bestimmte Vorhersage trifft. Lineare Modelle und einfache Entscheidungsbäume gelten als gut interpretierbar.

Gute vs. schlechte Modelle: Overfitting, Underfitting und Evaluation

Trainingsdaten

Daten, mit denen das Modell **lernt**. Das Modell sieht diese Beispiele während des Trainings.

Testdaten

Daten, mit denen das Modell **geprüft** wird. Es hat diese Beispiele vorher nicht gesehen.

Overfitting

Das Modell passt sich zu stark an die Trainingsdaten an (auswendig lernen) und funktioniert schlechter auf neuen Daten.

Underfitting

Das Modell ist zu simpel und kann selbst die Trainingsdaten nicht gut erklären. Es fängt die Struktur des Problems nicht ein.

Accuracy (Genauigkeit)

Anteil der **korrekten Vorhersagen** an allen Vorhersagen. Geeignet für viele Klassifikationsprobleme, aber problematisch bei stark unausgeglichenen Klassen.

Fehlerquote

Anteil der **falschen Vorhersagen**. Fehlerquote = 1 − Accuracy.

+2 more flashcards

Machine Learning in der Praxis: Anwendungen, Chancen und Risiken

Bias (Verzerrung)

Systematischer Fehler in Daten oder Modellen, der dazu führt, dass bestimmte Gruppen oder Ergebnisse vorhersehbar benachteiligt oder bevorzugt werden.

Fairness (in ML)

Eigenschaft eines Modells, bei der keine Gruppe systematisch schlechter oder besser behandelt wird, insbesondere keine schützenswerten Gruppen (z. B. Geschlecht, Herkunft).

Empfehlungssystem

ML-Anwendung, die vorhersagt, welche Inhalte (Filme, Produkte, Posts) für eine Person interessant sein könnten, basierend auf ihrem Verhalten und dem Verhalten ähnlicher Nutzer:innen.

DSGVO

Datenschutz-Grundverordnung der EU (seit 2018 in Kraft). Regelt den Umgang mit personenbezogenen Daten, inklusive Rechten der Betroffenen und Pflichten von Unternehmen/Organisationen.

Black-Box-Modell

ML-Modell, dessen innere Funktionsweise für Menschen schwer nachzuvollziehen ist. Es ist oft unklar, warum eine bestimmte Entscheidung getroffen wurde.

EU AI Act (KI-Verordnung)

Geplante EU-Verordnung zur Regulierung von KI-Systemen nach Risikostufen (z. B. hohes Risiko in Medizin, Bildung, Arbeit). Ziel ist u. a. mehr Sicherheit, Transparenz und Grundrechtsschutz.