Das menschliche Genom wird diverser |
Christina Hohmann-Jeddi |
12.05.2023 12:30 Uhr |
In einem neu erstellten Referenzgenom sind bislang Genome von 47 verschiedenen Menschen zusammen dargestellt – es sollen 350 Genome werden. / Foto: Adobe Stock/Sergey Nivens
Im Jahr 2001 wurde erstmals die Sequenz des menschlichen Genoms entschlüsselt und der Forschung zur Verfügung gestellt. Bis vor Kurzem galt dieses erste, weitestgehend von einem Individuum stammende Erbgut GRCh38 als Referenzgenom für genetische Analysen. Es wies aber noch Lücken auf, die das Telomere-to-Telomere-Konsortium (T2T) im Jahr 2022 mit der Veröffentlichung eines vollständigen Genoms (T2T-CHM13) schloss. Aber auch dieses stammt weitestgehend von einem Individuum und kann als einzelnes Genom nicht die genetische Diversität des Menschen abbilden.
Das internationale Forschungsteam Human Pangenome Reference Consortium (HPRC) hat sich dieses Problems angenommen und eine umfassende Genomversion erarbeitet, die möglichst viele verschiedene DNA-Varianten abbilden soll. Einen ersten Entwurf dieses Pangenoms stellt das HPRC aktuell im Fachjournal »Nature« vor. In ihm sind Gensequenzen von 47 Menschen unterschiedlicher Herkunft vereint und es enthält 119 Millionen Basenpaare und 1115 Genduplikationen mehr als das bisherige Referenzgenom GRCh38.
Das Ziel des Konsortiums ist es, die Erbgutsequenzen von 350 Individuen in einer Datenstruktur zu vereinen. Bereits jetzt sei das Pangenom dem bisherigen Referenzgenom aber überlegen, etwa beim Auffinden von Einzelnukleotidvariationen (SNV) oder größeren DNA-Variationen (Strukturvarianten), berichtet die Autorengruppe der Publikation. Insgesamt würden nun 99 Prozent des Genoms mit einer Genauigkeit auf Basenpaar-Level von 99 Prozent dargestellt. Ermöglicht wurde dies durch verbesserte Sequenziertechniken und Algorithmen, die die sequenzierten DNA-Abschnitte zusammensetzen.
In begleitenden Veröffentlichungen in derselben »Nature«-Ausgabe verwenden Forschungsgruppen das Pangenom für verschiedene Fragestellungen. In der ersten Publikation erarbeitete ein Team um Dr. Mitchell R. Vollger von der University of Washington in Seattle eine Karte von SNV in sogenannten Duplikations-Segmenten. Das sind DNA-Bereiche, die mehrfach an verschiedenen Stellen im Genom vorkommen und sich stark ähneln. Dabei entdeckten sie Millionen von bisher nicht kartierten SNV.
In der zweiten Arbeit von Dr. Andrea Guarracino und Kollegen von der University of Tennessee in Knoxville konnten die Forschenden in der DNA-Struktur Belege für einen DNA-Austausch finden, der bisher nur vermutet worden war, aber aufgrund von Datenmangel nicht nachgewiesen werden konnte.
»Das humane Pangenom als Referenz ist ein Meilenstein in der Genetik«, schreiben die Bioinformatiker Arya Massarat und Professor Dr. Melissa Gymrek von der University of California San Diego in einem »News & Views«-Artikel auf der »Nature«-Website. Die Nutzung von Pangenomen könnte die Genomforschung stark verändern und letztlich dazu führen, die Gesundheit vieler Menschen zu verbessern. Dies könne aber noch eine Weile dauern, denn zunächst müsse die Diversität des Pangenoms noch durch die Ergänzung weiterer Genome von Menschen unterschiedlicher Herkunft erhöht werden. Zudem müssten Genforscher sich zunächst neue Methoden zur Analyse des Pangenoms aneignen, die sich zum Teil noch in der Entwicklung befänden.
Das betont auch Professor Dr. Michael Nothnagel, Leiter der Forschungsgruppe Statistische Genetik und Bioinformatik an der Universität zu Köln: »Genetische Daten werden mit den neuen Technologien in grundsätzlich anderer und auch komplexerer Form als bisher abgebildet.« Für deren Verarbeitung und Analyse seien neue Werkzeuge notwendig, die sich aber bereits in der Entwicklung befänden und frei verfügbar sein würden oder schon seien. »Es ist zu erwarten, dass sich diese neuen Formate und Werkzeuge aufgrund ihrer Vorteile innerhalb weniger Jahre als neuer Standard in der biomedizinischen Forschung etablieren werden.«
Er erwartet durch die neuen Technologien medizinische Fortschritte. So sei die biomedizinische Forschung in Bezug auf Strukturvarianten in komplexrepetitiven DNA-Regionen bisher blind gewesen. »Die nun mögliche umfassendere genomweite Untersuchung solcher Varianten eröffnet ein großes neues Forschungsfeld zu den genetischen und biologischen Mechanismen, die der Entstehung von Krankheiten zugrunde liegen«, sagt Nothnagel. Es sei zu erwarten, dass Pathomechanismen für viele bereits bekannte Assoziationen von genetischen Varianten mit häufigen Krankheiten nun aufgeklärt werden könnten.
In Bezug auf die Abbildung der Diversität im Pangenom kommentiert Nothnagel, dass die angestrebten 350 Genome, die in die Datenstruktur einfließen sollen, ein wichtiger Zwischenschritt seien, aber nicht ausreichten. Es bestünden weiterhin größere Lücken beispielsweise für West- und Nordasien, Ozeanien sowie das südliche Afrika oder auch die australischen Aborigines. »Die Schließung dieser Lücken ist für die kommenden Jahre geplant und wird den Nutzen der Pangenom-Referenz noch einmal wesentlich steigern.«