Google-Firma sagt Proteinstrukturen voraus |
Theo Dingermann |
27.07.2021 13:00 Uhr |
Die Strukturaufklärung des menschlichen Proteoms könnte genauso bedeutend sein wie die Entschlüsselung des Genoms vor 20 Jahren. / Foto: Getty Images/Andrew Brookes
DeepMind, ein Unternehmen, das auf künstliche Intelligenz spezialisiert ist, wurde 2010 in London gegründet. Mittlerweile ist dieses Unternehmen Teil des Google-Imperiums. In die Schlagzeilen geriet die Firma, als es mit Hilfe eines von ihr entwickelten Programms gelang, den absoluten Star des alten chinesischen Brettspiels »Go« zu schlagen.
Nun verblüffte DeepMind die Life-Sciences-Community mit einer aktualisierten Version ihres Programms »AlphaFold«, mit dessen Hilfe es möglich ist, die dreidimensionale Struktur von Proteinen theoretisch mit hoher Präzision vorherzusagen. Ein Forscherteam um Kathryn Tunyasuvunakool berichtet in einer Publikation in »Nature«, über Arbeiten, die zu einer erstaunlichen Abdeckung der Strukturdetails menschlicher Proteine geführt haben. Waren bisher etwas 17 Prozent der Aminosäuren in menschlichen Proteinsequenzen durch eine experimentell bestimmte Strukturinformationen abgedeckt, erweitert das Forscherteam von DeepMind jetzt die strukturelle Abdeckung dramatisch. Mittels hochmoderner Methoden des maschinellen Lernens, die in das Programm AlphaFold implementiert sind, gelang es, theoretische Strukturanalysen an fast dem gesamten menschlichen Proteom (98,5 Prozent der circa 20.000 menschlichen Proteine) durchzuführen. Der resultierende Datensatz deckt rund 60 Prozent der Aminosäurereste mit einer guten Vorhersagegenauigkeit ab, von denen etwa 36 Prozent als sicher korrekt bestimmt gelten.
Bemerkenswert ist, dass die Firma die Resultate der von ihr entwickelten Vorhersagen über eine öffentlich zugängliche Datenbank der Wissenschaft frei zur Verfügung stellt. In dieser Datenbank sind auch die fast vollständige Proteome von fast 20 anderen Organismen enthalten, darunter die Proteome der Maus, von Mais bis hin zum Malariaparasiten, die ebenfalls mit AlphaFold gelöst wurden.
Freilich variieren die mehr als 350.000 Proteinstrukturen, die in der Datenbank gelistet sind, hinsichtlich ihrer Genauigkeit. Aber die Forscher gehen davon aus, dass die neuen Möglichkeiten der Strukturanalyse, mit deren Hilfe bis Ende des Jahres etwa 130 Millionen Strukturen analysiert werden sollen, das Potenzial haben, die Lebenswissenschaften zu revolutionieren. Denn die 3D-Struktur eines Proteins bestimmt weitgehend seine Funktion.
Entsprechend enthusiastisch sind die Reaktionen aus den Lebens- und Computerwissenschaften. »Aus meiner Sicht ist das total transformativ«, sagt Christine Orengo, eine Computerbiologin am University College London (UCL) in einem News-Beitrag von Nature, und sie ergänzt: »Wenn man die Formen all dieser Proteine kennt, bekommt man wirklich einen Einblick in ihre Mechanismen«.
Demis Hassabis, Mitbegründer und Geschäftsführer von DeepMind ergänzt: »Das ist der größte Beitrag, den ein KI-System bisher zum Fortschritt der Wissenschaft geleistet hat. Ich denke nicht, dass es übertrieben ist, das zu sagen«.
Allerdings ist dies zunächst ein Anfang und keineswegs das Ende einer bemerkenswerten Entwicklung. Denn die theoretisch vorhergesagten Proteinstrukturen müssen natürlich experimentell validiert werden. Aber es gibt gute Gründe, die Daten sehr ernst zu nehmen. Denn einige der von AlphaFold errechneten Strukturen stimmten erstaunlich gut mit den Strukturen überein, die experimentell ermittelt worden waren.
Doch auch die noch nicht so exakt bestimmten Strukturen könnten wichtige Hinweise für Wissenschaftler liefern. So gehen Biologen davon aus, dass große Teile der Proteine von Eukaryonten von Natur aus ungeordnet sind. Sie nehmen erst dann konkrete Strukturen an, wenn diese Proteine Interaktionen mit anderen Molekülen eingehen. »Viele Proteine sind in Lösung einfach nur wackelig, sie haben keine feste Struktur«, sagt der leitende AlphaFold-Forscher John Jumper. Tatsächlich konnte bereits gezeigt werden, dass einige Proteinbereiche, die bisher hinsichtlich ihrer Struktur nicht so exakt errechnet werden konnten, mit Proteinen übereinstimmen, von denen Biologen vermuten, dass sie in Lösung »ungeordnet« vorliegen.
Forscher verwenden bereits die von AlphaFold entwickelten Programme und Daten, um ihre eigenen experimentellen Strukturdaten zu interpretieren. Gleichzeitig werden die theoretisch ermittelten Strukturen auch intensiv mit experimentellen Daten überprüft. Denn je mehr man den Daten, die unter Zuhilfenahme von künstlicher Intelligenz ermittelt wurden, vertrauen kann, um so nützlich sind sie für Folgeprojekte.