Wie funktioniert AlphaFold?
Die AlphaFold-Pipeline verstehen: MSA, Evoformer, Attention und Confidence-Scores.
- Die SuS können die Funktionsweise von AlphaFold (MSA → Evoformer → Strukturmodul) in Grundzügen erklären und die Confidence-Metriken (pLDDT, PAE) interpretieren.K2
Material fĂĽr L2: AlphaFold-Funktionsweise. Siehe AB2_AlphaFold-verstehen.md im Material-Ordner.
AlphaFold hat das 50-jährige Proteinfaltungsproblem gelöst und 2024 den Nobelpreis für Chemie erhalten. In diesem Modul verstehst du, wie die KI aus einer Aminosäuresequenz eine 3D-Struktur vorhersagt.
Wie funktioniert AlphaFold?
AlphaFold ist ein KI-System von Google DeepMind, das die 3D-Struktur von Proteinen aus der Aminosäuresequenz vorhersagt. 2024 erhielten Demis Hassabis und John Jumper dafür den Nobelpreis für Chemie.
Die AlphaFold-Pipeline in 7 Schritten
- Input: Aminosäuresequenz (z.B. MKWVTFISLL...)
- MSA (Multiple Sequence Alignment): Vergleich mit evolutionär verwandten Sequenzen → konservierte Positionen erkennen
- Paarrepräsentation: N×N-Matrix mit Abstandsinformationen zwischen allen Aminosäurepaaren
- Evoformer: Attention-basiertes Netzwerk (48 Iterationen) → verarbeitet MSA + Paarinformationen
- Strukturmodul: Generiert 3D-Koordinaten aus der Paarrepräsentation
- Refinement: Physikbasierte Energieoptimierung (AMBER-Kraftfeld)
- Output: 3D-Struktur + Confidence-Scores
Der Evoformer — das Herzstück
Der Evoformer basiert auf der Transformer-Architektur (bekannt von ChatGPT, aber hier für Strukturvorhersage). Er nutzt Attention: Bei jeder Aminosäure kann das Netz auf alle anderen Aminosäuren «schauen» und entscheiden, welche relevant sind.
Nach 48 Durchläufen weiss das Netz, welche Aminosäuren nahe beieinander liegen — auch wenn sie in der Sequenz weit auseinander sind.
Training: Ăśberwachtes Lernen mit >170'000 bekannten Strukturen aus der Protein Data Bank (PDB).
Confidence-Scores lesen
AlphaFold liefert nicht nur eine Struktur, sondern auch eine Bewertung der Vorhersagequalität:
| pLDDT-Bereich | Confidence | Farbe in AlphaFold DB |
|---|---|---|
| > 90 | Sehr hoch | Blau |
| 70–90 | Vertrauenswürdig | Cyan |
| 50–70 | Niedrig | Gelb |
| < 50 | Unzuverlässig | Orange/Rot |
Wichtig: pLDDT < 50 heisst nicht zwingend «Fehler» — es kann auch eine intrinsisch ungeordnete Region (IDR) sein, die in der Natur keine feste Struktur hat.
Reflection
Wichtigste Erkenntnis:
AlphaFold lernt aus bekannten Strukturen, welche Muster zu welcher 3D-Form führen. Die Attention-Mechanik ermöglicht es, langreichweitige Abhängigkeiten zu erkennen — das war früher unmöglich.
Aber: AlphaFold sagt die Struktur voraus, nicht die Funktion. Die biologische Interpretation braucht weiterhin den Menschen.