ESMFold: Revolutionäre Fortschritte in der Proteinstrukturvorhersage durch Open-Source-KI
Hintergrund und Entwicklung von ESMFold
Forscher des Chan Zuckerberg Biohub in San Francisco haben mit ESMFold ein bahnbrechendes KI-Modell zur Vorhersage von Proteinstrukturen vorgestellt. Dieses Modell übertrifft bestehende Systeme wie AlphaFold3 in mehreren Bereichen. ESMFold basiert auf einem Proteinsprachmodell, das mit Milliarden von Proteinsequenzen aus verschiedenen Quellen trainiert wurde, darunter auch metagenomische Daten aus Umweltproben.
Überlegenheit und Anwendungsbereiche
ESMFold2, die neueste Version des Modells, zeigt besonders bei der Vorhersage von Proteinkomplexen herausragende Leistungen. Dazu gehören die Bindungen von Antikörpern an ihre Zielmoleküle. Diese Fähigkeit ist entscheidend für die Entwicklung neuer Therapeutika, insbesondere im Bereich der Krebsforschung. In Laborversuchen bestätigte sich, dass die vorhergesagten Strukturen zuverlässig funktionieren.
Der ESM Atlas: Eine umfassende Ressource
Der ESM Atlas, der mithilfe von ESMFold2 erstellt wurde, umfasst 1,1 Milliarden vorhergesagte Proteinstrukturen und Daten zu 6,8 Milliarden Proteinsequenzen. Diese frei zugängliche Datenbank ermöglicht es Forschern weltweit, neue Zusammenhänge zwischen Proteinen zu entdecken. Ein Beispiel ist die Entdeckung struktureller Ähnlichkeiten zwischen CRISPR-Proteinen und einem Gen-Editierprotein aus einem Bodenpilz.
Wissenschaftliche Rezeption und Kritik
Die wissenschaftliche Gemeinschaft zeigt sich beeindruckt von den Fortschritten, die mit ESMFold erzielt wurden. Gemma Atkinson von der Universität Lund bezeichnet den ESM Atlas als eine außergewöhnliche Ressource. Martin Steinegger von der Seoul National University stellt jedoch Fragen zur Zuverlässigkeit des Modells bei ungewöhnlichen Proteinstrukturen. Sergey Ovchinnikov vom MIT sieht ESMFold als wertvolle Ergänzung zu bestehenden Datenbanken wie AlphaFold, betont jedoch, dass es nicht als vollständiger Ersatz betrachtet werden sollte.
Zukunftsperspektiven und offene Fragen
Die vollständige Quelloffenheit und die fehlenden kommerziellen Nutzungseinschränkungen von ESMFold2 könnten zu einer breiten Anwendung in der Forschung führen. Dennoch bleiben Fragen zur Genauigkeit bei seltenen Proteinstrukturen und zur Vergleichbarkeit mit anderen Modellen offen. Die kontinuierliche Weiterentwicklung und Validierung solcher Modelle wird entscheidend sein, um ihr volles Potenzial auszuschöpfen.