Google-Firma sagt Proteinstrukturen voraus |
Theo Dingermann |
27.07.2021 13:00 Uhr |
Die Strukturaufklärung des menschlichen Proteoms könnte genauso bedeutend sein wie die Entschlüsselung des Genoms vor 20 Jahren. / Foto: Getty Images/Andrew Brookes
DeepMind, ein Unternehmen, das auf künstliche Intelligenz spezialisiert ist, wurde 2010 in London gegründet. Mittlerweile ist dieses Unternehmen Teil des Google-Imperiums. In die Schlagzeilen geriet die Firma, als es mit Hilfe eines von ihr entwickelten Programms gelang, den absoluten Star des alten chinesischen Brettspiels »Go« zu schlagen.
Nun verblüffte DeepMind die Life-Sciences-Community mit einer aktualisierten Version ihres Programms »AlphaFold«, mit dessen Hilfe es möglich ist, die dreidimensionale Struktur von Proteinen theoretisch mit hoher Präzision vorherzusagen. Ein Forscherteam um Kathryn Tunyasuvunakool berichtet in einer Publikation in »Nature«, über Arbeiten, die zu einer erstaunlichen Abdeckung der Strukturdetails menschlicher Proteine geführt haben. Waren bisher etwas 17 Prozent der Aminosäuren in menschlichen Proteinsequenzen durch eine experimentell bestimmte Strukturinformationen abgedeckt, erweitert das Forscherteam von DeepMind jetzt die strukturelle Abdeckung dramatisch. Mittels hochmoderner Methoden des maschinellen Lernens, die in das Programm AlphaFold implementiert sind, gelang es, theoretische Strukturanalysen an fast dem gesamten menschlichen Proteom (98,5 Prozent der circa 20.000 menschlichen Proteine) durchzuführen. Der resultierende Datensatz deckt rund 60 Prozent der Aminosäurereste mit einer guten Vorhersagegenauigkeit ab, von denen etwa 36 Prozent als sicher korrekt bestimmt gelten.
Bemerkenswert ist, dass die Firma die Resultate der von ihr entwickelten Vorhersagen über eine öffentlich zugängliche Datenbank der Wissenschaft frei zur Verfügung stellt. In dieser Datenbank sind auch die fast vollständige Proteome von fast 20 anderen Organismen enthalten, darunter die Proteome der Maus, von Mais bis hin zum Malariaparasiten, die ebenfalls mit AlphaFold gelöst wurden.
Freilich variieren die mehr als 350.000 Proteinstrukturen, die in der Datenbank gelistet sind, hinsichtlich ihrer Genauigkeit. Aber die Forscher gehen davon aus, dass die neuen Möglichkeiten der Strukturanalyse, mit deren Hilfe bis Ende des Jahres etwa 130 Millionen Strukturen analysiert werden sollen, das Potenzial haben, die Lebenswissenschaften zu revolutionieren. Denn die 3D-Struktur eines Proteins bestimmt weitgehend seine Funktion.