Y-Chromosom fertig sequenziert |
Theo Dingermann |
24.08.2023 09:00 Uhr |
Es ist anders alle anderen Chromosomen und wurde jetzt auch als letztes fertig sequenziert: Das Y-Chromosom des Menschen. / Foto: Adobe Stock/vchalup
Dass das 2003 offiziell abgeschlossene Humangenomprojekt (HGP) auch nach 20 Jahren selbst hinsichtlich der Ermittlung der exakten Basenzusammensetzung immer noch etliche weiße Flecken offengelassen hat, wird dadurch deutlich, dass aktuell in »Nature« eine Publikation mit dem Titel »The complete sequence of a human Y chromosome« erschienen ist. Fachleuten war natürlich bekannt, dass der Basenkatalog noch unvollständig war, ganz zu schweigen von dem Katalog zu den Funktionen aller humanen Gene.
Um so wichtiger ist die aktuelle Publikation, in der die vielen Probleme und deren Lösung beschrieben sind, das Programm des äußerst komplex organisierten Y-Chromosoms zu entschlüsseln. Forschende vom Telomere-to-Telomere-Konsortium (T2T) mit Dr. Arang Rhie vom National Human Genome Research Institute der National Institutes of Health in Bethesda als Erstautor präsentieren die vollständige 62.460.029 Basenpaare umfassende Sequenz des menschlichen Y-Chromosoms.
Mit der nun veröffentlichten Sequenz wurde das neue Referenzgenom des Menschen aus der sogenannten CHM13-Zelllinie fertiggestellt, das sicherlich das bisherige Referenzgenom GRCh38 (vom Humangenomprojekt) ablösen wird. Dieses enthält die unter Zuhilfenahme modernster Techniken neu ermittelte Basenabfolge aller Chromosomen von Telomer zu Telomer zusammen mit einer vollständigen Annotation der Gen-, Repeat- und Organisationsstruktur.
Tatsächlich war bisher in dem menschlichen Referenzgenom mit dem Kürzel »GRCh38« das Y-Chromosom nur sehr unvollständig charakterisiert. Genauer gesagt fehlten Sequenzinformationen für mehr als der Hälfte dieses Chromosoms, das bekanntlich durchaus bedeutsam ist, enthält es doch unter anderem entscheidende Informationen für die männliche Fruchtbarkeit in Form der Gene, die für die Spermienproduktion notwendig sind. Zudem liegt auf dem Y-Chromosom mit dem SRY-Gen die genetische Information, die das Geschlecht bei den Säugern festlegt.
Die jetzt geschlossenen Lücken befinden sich zum einen in Sequenzen rund um das Zentromer, also der zentralen Verbindungsstelle der beiden Chromatiden eines Chromosoms, die notorisch schwierig zu sequenzieren sind. Zum anderen lagen die Sequenzlücken in Segmenten von Amplikonbereichen, in denen eine bestimmte DNA-Sequenzen mehrfach hintereinander aufgereiht vorliegt, und in ausgedehnten heterochromatischen Bereichen, in denen die DNA stark an Histon- und Nicht-Histon-Proteinen gebunden vorliegt.
Was neu entdeckt wurde: Das Team um Rhie erweitert das aktuelle Referenzgenom um mehr als 30 Millionen Basenpaare, wodurch die vollständigen Strukturen einer Reihe von Genfamilien sichtbar werden und 41 neue proteinkodierende Gene identifiziert werden. Die Ergebnisse korrigieren auch Annahmen, die in Mikrobiom-Studien gemacht wurden, in denen zuvor unbekannte menschliche Y-Chromosom-Sequenzen fälschlicherweise als bakterielle Sequenzen zugeordnet wurden.
Erst durch innovative Fortschritte bei den Sequenzierungstechnologien gelang es, diese weißen Flecken im Y-Chromosom mit sehr genauer Sequenzinformation zu füllen. Insbesondere Techniken, die als »High-Fidelity-Reads (HiFi)« des Unternehmens Pacific Biosciences und als ultralange Reads (ONT) von Oxford Nanopore bezeichnet werden, waren hier maßgeblich für die erfolgreiche Entschlüsselung der komplizierten Genombereiche verantwortlich.
Das neue Referenzgenom, das von den Mitgliedern des Telomere-to-Telomere(T2T)-Konsortiums ermittelt wurde, wird vermutlich T2T-CHM13+Y heißen. Anhand dieses Referenzgenoms werden sich genetische Varianten in Patientengenomen deutlich zuverlässiger beschreiben lassen, als dies mit dem früheren GRCh38-Assembly möglich war.
Diverser wird das Y-Chromosom in einer zweiten Publikation in der gleichen Ausgabe von Nature. Hier präsentieren Dr. Pille Hallast vom The Jackson Laboratory for Genomic Medicine in Farmington, Connecticut, und Kollegen die de novo Zusammenstellungen von 43 Y-Chromosomen, die die fünf kontinentalen Gruppen des 1000 Genomes Projects repräsentieren und die 183.000 Jahre menschlicher Evolution abdecken.
Während sowohl die GRCh38- als auch die T2T-CHM13+Y-Referenzgenome europäische Y-Linien repräsentieren, stellt die Hälfte der Y-Chromosomen, die in dieser Arbeit vorgestellt werden, afrikanische Linien dar. Insgesamt kann die Liste der hier publizierten 43 Y-Chromosomensequenzen für sich beanspruchen, eine sehr gute Sammlung der am tiefsten verwurzelten menschlichen Y-Linien zu repräsentieren.
Bereits auf Basis dieser ersten, noch nicht erschöpfenden Analyse der Struktur und Evolution von Y-Chromosomen lässt sich viel lernen. So zeigt sie beispielsweise, dass die Hälfte der euchromatischen, also Gen-reichen Region der Y-Chromosomen aus großen Inversionen von DNA-Abschnitten (Umkehrungen) mit einer mehr als zweifach höheren Wiederholungsrate im Vergleich zu allen anderen Chromosomen besteht.
Amplikonische Sequenzen, also Sequenzen, die aus Y-spezifischen Wiederholungseinheiten bestehen, sind mit den Inversionen assoziiert, weisen unterschiedliche Mutationsraten auf, die vom Sequenzkontext abhängig sind, und zeigen Anzeichen für eine konzertierte Evolution mit dem Erwerb und der Löschung von abstammungsspezifischen Pseudogenen.
Die größte heterochromatische Region im menschlichen Genom, Yq12, besteht aus alternierenden Repeat-Arrays, die in Anzahl, Größe und Verteilung stark variieren. Demgegenüber liegen die Gene, die auf den Y-Chromosomen nur in Form einer einzigen Kopie für ein Protein kodieren, in allen 43 untersuchten Y-Chromosomen mit Ausnahme weniger Punktmutationen extrem konserviert vor. Das ist anders bei den Multi-Copy-Genen, die deutlich mehr Mutationen aufweisen. Zudem beobachtet man bei diesen Genen variierende Kopienzahlen.
Die geringe Anzahl an Einzelbasenaustauschen in Genen, die nur in einer Kopie auf dem Y-Chromosom vorhanden sind, stimmt mit früheren Studien überein, in denen gezeigt wurde, dass durch den Rückgang der effektiven männlichen Bevölkerungsgröße vor etwa 5000 bis 7000 Jahren, der zu einer Knappheit funktionierender Y-Chromosomen führte, und einer damit einhergehenden korrigierenden Selektion, schädliche Mutationen und damit verbundene Proteinvarianten verloren gingen.
Die Verfügbarkeit von vollständig sehr exakt sequenzierten Y-Chromosomen von mehreren Individuen bietet nun eine einzigartige Gelegenheit, neue Assoziationen von Merkmalen mit spezifischen Y-Chromosomenvarianten zu identifizieren und noch tiefere Einblicke in die Evolution und Funktion komplexer Regionen des menschlichen Genoms zu gewinnen.