Wie funktioniert AlphaFold?

lock
Bevorstehend

Die AlphaFold-Pipeline verstehen: MSA, Evoformer, Attention und Confidence-Scores.

Ziele dieses Moduls
  • Die SuS können die Funktionsweise von AlphaFold (MSA → Evoformer → Strukturmodul) in GrundzĂĽgen erklären und die Confidence-Metriken (pLDDT, PAE) interpretieren.
    K2
attachment Materialien
    sticky_note_2
    AB2 — AlphaFold verstehen

    Material fĂĽr L2: AlphaFold-Funktionsweise. Siehe AB2_AlphaFold-verstehen.md im Material-Ordner.

label
AlphaFoldKI

AlphaFold hat das 50-jährige Proteinfaltungsproblem gelöst und 2024 den Nobelpreis für Chemie erhalten. In diesem Modul verstehst du, wie die KI aus einer Aminosäuresequenz eine 3D-Struktur vorhersagt.

Wie funktioniert AlphaFold?

AlphaFold ist ein KI-System von Google DeepMind, das die 3D-Struktur von Proteinen aus der Aminosäuresequenz vorhersagt. 2024 erhielten Demis Hassabis und John Jumper dafür den Nobelpreis für Chemie.

Die AlphaFold-Pipeline in 7 Schritten

  1. Input: Aminosäuresequenz (z.B. MKWVTFISLL...)
  2. MSA (Multiple Sequence Alignment): Vergleich mit evolutionär verwandten Sequenzen → konservierte Positionen erkennen
  3. Paarrepräsentation: N×N-Matrix mit Abstandsinformationen zwischen allen Aminosäurepaaren
  4. Evoformer: Attention-basiertes Netzwerk (48 Iterationen) → verarbeitet MSA + Paarinformationen
  5. Strukturmodul: Generiert 3D-Koordinaten aus der Paarrepräsentation
  6. Refinement: Physikbasierte Energieoptimierung (AMBER-Kraftfeld)
  7. Output: 3D-Struktur + Confidence-Scores

Der Evoformer — das Herzstück

Der Evoformer basiert auf der Transformer-Architektur (bekannt von ChatGPT, aber hier für Strukturvorhersage). Er nutzt Attention: Bei jeder Aminosäure kann das Netz auf alle anderen Aminosäuren «schauen» und entscheiden, welche relevant sind.

Nach 48 Durchläufen weiss das Netz, welche Aminosäuren nahe beieinander liegen — auch wenn sie in der Sequenz weit auseinander sind.

Training: Ăśberwachtes Lernen mit >170'000 bekannten Strukturen aus der Protein Data Bank (PDB).

Confidence-Scores lesen

AlphaFold liefert nicht nur eine Struktur, sondern auch eine Bewertung der Vorhersagequalität:

pLDDT-BereichConfidenceFarbe in AlphaFold DB
> 90Sehr hochBlau
70–90VertrauenswürdigCyan
50–70NiedrigGelb
< 50UnzuverlässigOrange/Rot

Wichtig: pLDDT < 50 heisst nicht zwingend «Fehler» — es kann auch eine intrinsisch ungeordnete Region (IDR) sein, die in der Natur keine feste Struktur hat.

Reflection

Wichtigste Erkenntnis:

AlphaFold lernt aus bekannten Strukturen, welche Muster zu welcher 3D-Form führen. Die Attention-Mechanik ermöglicht es, langreichweitige Abhängigkeiten zu erkennen — das war früher unmöglich.

Aber: AlphaFold sagt die Struktur voraus, nicht die Funktion. Die biologische Interpretation braucht weiterhin den Menschen.