KI nicht mehr wegzudenken |
Die Natur nutzt nur einen kleinen Teil der möglichen Proteinsequenzen und -strukturen. Im Proteindesign wird eine neue Aminosäuresequenz für eine Proteinstruktur gesucht, die eine bestimmte Funktion erfüllt. Dies wird seit einigen Jahrzehnten computerbasiert versucht, in jüngerer Zeit mit immer mehr Erfolg. Viele proteinogene Wirkstoffe sind von natürlichen Proteinen abgeleitet und modifiziert. Heutzutage beschäftigen sich Forschende vermehrt mit der Frage, ob Proteine komplett neu – ohne natürliche Grundlage – designt werden können. Dann spricht man von De-novo-Design (11).
Am Computer designte Proteine werden im Labor hergestellt und analysiert. Eine Mitarbeiterin des Instituts für Wirkstoffentwicklung in Leipzig bereitet Proben für Gelelektrophoresen vor, um die Größe des jeweiligen Proteins festzustellen. / Foto: IWE/Victoria Most
Mithilfe von Computersoftware, zum Beispiel der Rosetta Software (12, 13), können neue Proteinfaltungen generiert werden, die anschließend sequenzoptimiert werden. Die Rosetta Software basiert auf einem stochastischen Suchverfahren, das eine Energiefunktion, bestehend aus biophysikalischen und wissensbasierten Komponenten, verwendet, um die Ergebnisse zu evaluieren (14).
Das erste Protein, das durch solch ein computergestütztes Verfahren designt wurde, war im Jahr 2003 »Top7«, das damals eine zuvor noch nicht beobachtete Proteinfaltung aufwies (15). Später stellte sich allerdings heraus, dass diese Faltung in der Natur bereits existierte. Die finale Vision des De-novo-Designs ist, dass Proteine und proteinogene Wirkstoffe zielgenau im Computer ohne aufwendige experimentelle Optimierungen entwickelt werden können.
Innerhalb der letzten zwei Jahre wurde eine Vielzahl an Proteindesign-Modellen entwickelt, die KI verwenden, zum Teil mit beeindruckenden Ergebnissen. Dabei gibt es unterschiedliche Ansätze wie große Sprachenmodelle, die Aminosäuresequenzen wie Sprachen interpretieren, strukturbasierte Methoden, die die Wahrscheinlichkeit des Auftretens einer Aminosäure aus dem strukturellen Kontext wiedergeben oder Diffusionsmodelle, die Proteinrückgrate ähnlich wie Bildschärfung aus willkürlich platzierten Atomen und Aminosäuren bauen können.
KI-Methoden wie diese werden zurzeit intensiv erforscht und mit den bisherigen biophysikalischen Methoden verglichen, um ihre Stärken und Grenzen zu evaluieren. Ein großer Vorteil, der sich aus der Anwendung von KI ergibt, ist die Schnelligkeit und einfache Bedienbarkeit des Codes. Es ist aber oft schwer nachzuvollziehen, warum das Modell eine bestimmte Aminosäure wählt.
Durch künstliche Intelligenz könnte die Entwicklung therapeutischer Antikörper künftig kostengünstiger werden. / Foto: Adobe Stock/Dr_Microbe
Zwei sehr wichtige Einsatzgebiete für Proteindesign sind Antikörper und Impfstoffe. Antikörper sind strukturell immer gleich aufgebaut: Zwei leichte und zwei schwere Ketten kommen in der variablen Domäne zu der komplementaritätsbestimmenden Region zusammen, die eine sehr hohe Variabilität aufweist und während der Antikörperreifung optimal an das zu bindende Epitop angepasst wird. Unzählige Methoden sind für das strukturbasierte Design von Antikörpern entworfen worden, um deren Bindung an andere oder mutierte Epitope anzupassen (16). Außerdem wird computergestütztes Design verwendet, um pharmakokinetische Parameter von Antikörpern zu optimieren.
Im Impfstoffdesign werden computergestützte Methoden verwendet, um virale Glykoproteine, die sich auf Virusoberflächen befinden und oft labil sind, zu stabilisieren (17). Diese Methoden sind ein Schwerpunkt der Forschung am Institut für Wirkstoffentwicklung (IWE) in Leipzig, wo sich Wissenschaftlerinnen und Wissenschaftler damit beschäftigen, wie im Pandemiefall am Computer schnell neue Vakzinen entwickelt werden können.
Herausforderungen im Bereich des computergestützten Proteindesigns sind vor allem Fragestellungen, die über den kanonischen Aminosäurecode hinausgehen. Dort ist die Datenlage, um KI-Modelle zu trainieren, nicht gegeben oder lückenhaft. Beispiele sind hier das Design mit nicht-kanonischen Aminosäuren oder post-translationale Modifikationen, die für die chemische Diversifizierung und viele biologische Funktionen essenziell sind.