Training & Optimierung: Wie lernt ein Modell?

Fehlerfunktion Loss Overfitting und Train/Test-Split verstehen. Praktische Übung mit Python und scikit-learn.

Training: Fehlerfunktion & Optimierung

Wie weiss ein Modell ob es richtig liegt? Und wie wird es besser?

Vorhersage vs. Realität

Das Modell macht eine Vorhersage ŷ (y-Hut). Der tatsächliche Wert heisst y. Der Fehler ist die Differenz: Fehler = y − ŷ.

Loss / Verlustfunktion

Die Loss-Funktion misst wie falsch das Modell insgesamt liegt. Ein bekanntes Mass: der mittlere quadratische Fehler (MSE) – er quadriert alle Einzel fehler und mittelt sie.

Je kleiner der Loss desto besser das Modell.

Training = Fehler minimieren

Beim Training werden die Parameter (Gewichte) des Modells schrittweise angepasst bis der Fehler möglichst klein ist. Das ist wie ein Gradientenabstieg: man «rutscht» den Fehlerberg hinunter.

Overfitting

Wenn das Modell die Trainingsdaten auswendig lernt statt die zugrundeliegenden Muster. Folge: Es funktioniert perfekt bei den Trainingsdaten aber schlecht bei neuen Daten.

Train/Test-Split

Deshalb teilen wir die Daten auf:

Trainingsdaten (z.B. 75%): Zum Trainieren des Modells
Testdaten (z.B. 25%): Zum Überprüfen ob das Modell wirklich generalisiert

Wenn der Trainings-Score hoch ist aber der Test-Score niedrig → Overfitting!

Aufgabe · Lineare Regression mit Python (20 min)

Du arbeitest mit scikit-learn der wichtigsten ML-Bibliothek für Python.

Deine Aufgabe

Führe den Starter-Code aus und beobachte den Train- und Test-Score

Verändere test_size (z.B. 0.1 0.5) – was passiert?

Provoziere Overfitting: Verwende ein komplexeres Modell (z.B. PolynomialFeatures mit Grad 10)

Fragen zum Beantworten

Was bedeutet ein Score von 1.0 auf Trainingsdaten aber 0.3 auf Testdaten?

Warum ist der Test-Score wichtiger als der Trainings-Score?

Ab wann würdest du sagen: «Das Modell ist overfitted»?

from sklearn.linear_model import LinearRegression from sklearn.model_selection import train_test_split import numpy as np # Beispieldaten: Lernzeit (h) → Testergebnis (Punkte) X = np.array([[1], [2], [3], [4], [5], [6], [7], [8]]) y = np.array([40, 50, 55, 60, 68, 72, 78, 85]) # Train/Test-Split (75% Train, 25% Test) X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.25, random_state=42 ) # Modell erstellen und trainieren model = LinearRegression() model.fit(X_train, y_train) # Scores ausgeben print("Train-Score:", model.score(X_train, y_train)) print("Test-Score: ", model.score(X_test, y_test)) print("Vorhersage für 5h Lernzeit:", model.predict([[5]]))

Reflexion & Diskussion: Was kann ML – was nicht?

Think-Pair-Share: Diskutiert mit deinem Nachbarn – wo sind die Grenzen von ML?

Was braucht ein gutes Modell zwingend?

Genug (repräsentative) Trainingsdaten: Wenige oder einseitige Daten → schlechte Vorhersagen

Korrekte Labels bei Supervised Learning: Falsche Labels → falsches Modell

Geeignete Problemstruktur: Nicht jedes Problem ist ML-geeignet. Manchmal reicht eine einfache Regel

ML kann nicht...

... «verstehen» was es tut – es erkennt nur statistische Muster

... commonsense-Entscheidungen treffen ohne Trainingsdaten

... erklären warum es eine Entscheidung getroffen hat (Black-Box-Problem)