Neuronale Netze & Deep Learning

Aufbau neuronaler Netze Aktivierungsfunktionen Backpropagation und Deep Learning. Praktische Übung mit dem TensorFlow Playground.

Neuronale Netze: Aufbau und Funktionsweise

Ein Neuronales Netz ist die populärste ML-Methode. Es ist inspiriert vom menschlichen Gehirn besteht aber aus Matrizen-Multiplikation und Zahlen.

Das einzelne Neuron

Ein Neuron nimt Eingaben multipliziert sie mit Gewichten und wendet eine Aktivierungsfunktion an → das ergibt die Ausgabe.

Einfach gesagt: Eingaben rein → gewichten → aktivieren → Ausgabe raus.

Schichten (Layers)

Input-Layer: Nimt die Daten auf (z.B. Pixel eines Bildes)
Hidden Layer(s): Verarbeiten die Daten in mehreren Stufen
Output-Layer: Gibt die Vorhersage aus (z.B. «Katze: 95% Hund: 5%»)

Analogie: Stell dir einen Betrieb vor. Jede Schicht ist eine Abteilung die Informationen verarbeitet und an die nachste weitergibt. Je mehr Abteilungen desto komplexere Aufgaben konnen bewältigt werden.

Aktivierungsfunktion

Ohne Aktivierungsfunktion ware das Netz nur eine einzige lineare Abbildung – egal wie viele Schichten. Deshalb braucht jede Schicht eine nicht-lineare Funktion:

ReLU (Rectified Linear Unit): max(0, x) – alles Negative wird zu 0
Sigmoid: Quetscht Werte zwischen 0 und 1 (Wahrscheinlichkeit)

Backpropagation

So lernt das Netz:

Das Netz macht eine Vorhersage
Wir vergleichen mit dem richtigen Ergebnis
Der Fehler wird rückwarts durch alle Schichten propagiert
Die Gewichte werden angepasst um den Fehler zu reduzieren
Diesen Prozess wiederholen wir tausende Male

Deep Learning

Viele Hidden Layers = Deep Learning. Tiefe Netze lernen hierarchische Merkmale: die erste Schicht erkennt einfache Muster (Kanten) die nachsten bauen darauf auf (Formen Gesichter Objekte).

Aufgabe · Entscheidungsgrenze verstehen (20 min)

Geht auf playground.tensorflow.org (oder arbeitet mit dem Screenshot-Handout falls kein Laptop verfügbar).

Schritt-für-Schritt

Datensatz «Circle» wählen. Trainiert mit 0 Hidden Layers. Was passiert? Warum?

1 Hidden Layer mit 4 Neuronen hinzufugen. Wie verändert sich die Entscheidungsgrenze?

Notiert: Welche Merkmale (Features) braucht das Netz mindestens um die Kreise zu trennen?

Bonus: Fugt Rauschen (Noise) hinzu. Was passiert mit der Genauigkeit? Warum?

Plenumsdiskussion (3 min)

Jede Gruppe präsentiert eine Beobachtung. Wir sammeln die Erkenntnisse an der Tafel.

Was haben wir gesehen?

Ohne Hidden Layer: Das Netz kann nur lineare Grenzen ziehen – bei Kreisen reicht das nicht

Mit Hidden Layer: Das Netz lernt nicht-lineare Entscheidungsgrenzen

Mehr Schichten = komplexere Muster aber auch Gefahr von Overfitting

Rauschen stört das Training – das Modell muss robust genug sein um das Signal vom Rauschen zu trennen

Kernbotschaft: Die Architektur des Netzes (Anzahl Schichten Neuronen Aktivierungsfunktionen) bestimmt was es lernen kann.