Der bislang umfassendste Einblick in das menschliche Genom wird die Diagnose seltener Krankheiten und Krebs beschleunigen.
Spanische Forscher vom Center for Genomic Regulation haben an der Erstellung des bislang umfassendsten Katalogs genetischer Variationen mitgewirkt und dabei einige der am schwierigsten zu identifizierenden und am wenigsten beachteten Regionen des menschlichen Genoms entschlüsselt. Dieser Durchbruch, der diesen Mittwoch in zwei Artikeln in der Fachzeitschrift Nature veröffentlicht wurde, wird die Diagnose seltener Krankheiten und Krebs beschleunigen.
„Jedes menschliche Genom weist rund 25.000 Strukturvarianten auf, aber nur eine davon verursacht Krankheiten. Deshalb ist es notwendig, den Suchraum einzugrenzen und nach Varianten zu suchen. Mit den aktuellen Referenzen können wir von 25.000 auf einige Tausend kommen, aber das ist immer noch die Suche nach der Nadel im Heuhaufen. Dank dieser neuen Referenz, die wir im Rahmen dieser Arbeit veröffentlichen , haben wir den Suchraum auf weniger als 200 Kandidatenvarianten eingegrenzt , was die genetische Diagnose in der klinischen Praxis erheblich erleichtert“, erklärte Dr. Bernardo Rodríguez-Martín, Co-Korrespondenzautor der Studie, während der Pressekonferenz zur Präsentation der Ergebnisse.
„Diese Arbeit stellt die bislang umfassendste Referenz zur strukturellen genetischen Variation im menschlichen Genom dar. Sie ist ein Fortschritt hin zu einer personalisierten Medizin auf der Grundlage genomischer Informationen“, fügte er hinzu. Der Experte erklärte, dass Krankenhäuser wie das Sant Joan de Deu, das mit der CGR zusammenarbeitet, diese Technologien bereits zur Diagnose seltener Krankheiten bei Kindern einsetzen.
Darüber hinaus können diese neuen Technologien zur Erforschung von krebserregenden Mutationen eingesetzt werden. „Bei 15 % der Patienten wird keine krebserregende Mutation gefunden, was möglicherweise daran liegt, dass frühere Technologien sie nicht erkennen konnten. Eine weitere große Herausforderung besteht darin, die Mutationen zu verstehen, die sich im Laufe unseres Lebens ansammeln. Diese Technologie ermöglicht es uns, mit beispielloser Auflösung zu verstehen, wie wir mit zunehmendem Alter und aufgrund von Umwelt- und Lebensstilfaktoren Mutationen ansammeln“, fügt der Forscher hinzu, der einräumt, dass eine der Einschränkungen die immer noch hohen Kosten der Sequenzierung sind. „ Die Sequenzierung eines Genoms kostet tausend Euro . In den letzten fünf Jahren sind diese Kosten deutlich gesunken, etwa um das Fünffache. Wir können uns also eine nicht allzu ferne Zukunft vorstellen, in der die Preise in etwa fünf Jahren ausreichend gesunken sein werden und wir mit dieser Technologie für ein paar Hundert Euro ein Genom sequenzieren können“, schließt er.
Im Jahr 2003 wurde das menschliche Genom erstmals sequenziert. Dabei stellte sich heraus, dass 60 % des Genoms aus repetitiver DNA besteht, die restlichen 8 % jedoch aufgrund ihrer Komplexität noch ungeklärt blieben. Im Jahr 2015 sequenzierte das 1000-Genome-Projekt mehr als 1.000 menschliche Genome aus 26 Populationen weltweit. Die Einschränkungen dieser Technologien, die DNA nur in sehr kurzen Fragmenten lesen können, ließen jedoch weite Teile des Genoms unerforscht. Zwischen 2021 und 2023 wird das gesamte menschliche Genom dank der Long-Read-Technologie, jedoch in einer einzigen Referenz, entschlüsselt sein. Das Pangenome-Projekt erweitert die Anzahl der Referenzen um 47 Individuen aus fünf Kontinenten.
Nun haben Forscher den Katalog der bekannten genetischen Variationen des Menschen deutlich erweitert. Die daraus resultierenden Datensätze, die diesen Mittwoch in Nature veröffentlicht wurden, stellen den bislang umfassendsten Überblick über das menschliche Genom dar. Die erste Studie, die gemeinsam vom Europäischen Laboratorium für Molekularbiologie (EMBL), der Heinrich-Heine-Universität Düsseldorf (HHU) und dem Centre for Genomic Regulation (CRG) in Barcelona geleitet wurde, analysierte die Genome von 1.019 Individuen aus 26 Populationen auf fünf Kontinenten.
Die Forscher suchten gezielt nach Strukturvarianten im menschlichen Genom. Dabei handelt es sich um große DNA-Fragmente, die gelöscht, dupliziert, eingefügt, invertiert oder neu angeordnet wurden. Unterschiede in den Strukturvarianten zwischen Individuen können Veränderungen in Tausenden von DNA-Buchstaben gleichzeitig beinhalten, was oft zum Ausschalten von Genen und zur Entstehung vieler seltener Krankheiten und Krebsarten führt.
Das Team fand und kategorisierte mehr als 167.000 Strukturvarianten bei den 1.019 Individuen und verdoppelte damit die bekannte Menge an Strukturvariationen im menschlichen Pangenom, einem Benchmark, der die DNA vieler Menschen verknüpft, anstatt sich auf ein einzelnes Genom zu verlassen. Jeder Mensch wies im Durchschnitt 7,5 Millionen Buchstaben struktureller Veränderungen auf, was das enorme Ausmaß der Genombearbeitung verdeutlicht, das die Natur selbst vornimmt.
„Wir haben in diesen Populationen eine Fülle verborgener genetischer Variationen entdeckt, von denen viele in früheren Referenzdatensätzen unterrepräsentiert waren. Beispielsweise waren 50,9 % der von uns gefundenen Insertionen und 14,5 % der Deletionen in früheren Variationskatalogen nicht erfasst. Dies ist ein wichtiger Schritt zur Kartierung blinder Flecken im menschlichen Genom und zur Reduzierung der Verzerrung, die lange Zeit Genome europäischer Abstammung begünstigt hat. Dies ebnet den Weg für Therapien und Tests, die bei Menschen weltweit gleichermaßen gut funktionieren“, sagt Dr. Bernardo Rodríguez-Martín.
Etwa drei von fünf (59 %) der entdeckten Varianten traten bei weniger als einem Prozent der Personen auf – ein entscheidender Seltenheitsgrad für die Diagnose genetischer Erkrankungen, da er dazu beitragen kann, harmlose Variationen effektiver herauszufiltern . Bei Tests reduziert das neue Referenzset die Liste der vermuteten Mutationen von Zehntausenden auf nur wenige Hundert und beschleunigt so die Diagnose seltener genetischer Syndrome und anderer Erkrankungen wie Krebs.
Bernardo Rodríguez-Martín begann seine Arbeit an dem Projekt im Labor von Jan Korbel am EMBL und schloss es ab, nachdem er an die CRG gewechselt war, um dort seine eigene Gruppe zu gründen. Er entwickelte SVAN, ein Softwareprogramm, das jede DNA-Veränderung entweder als „zusätzlich kopiertes Stück“ oder als „gelöschtes Fragment“ kategorisiert und dem Team hilft, die genetischen Daten zu analysieren und neue Muster zu identifizieren.
SVAN zeigte, dass mehr als die Hälfte der neu kartierten Diversität des menschlichen Genoms in hochrepetitiven DNA-Abschnitten lokalisiert ist – Teilen des Genoms, die bisher als Schrott galten oder zu schwer zu untersuchen waren. „Repetitive Elemente stellen ein reichhaltiges und bisher ignoriertes Reservoir genetischer Vielfalt dar. Sie spielen eine Schlüsselrolle bei der menschlichen Vielfalt, bei Krankheiten und in der Evolution“, sagt Emiliano Sotelo-Fonseca, CRG-Doktorand und Co-Autor der ersten Studie.
Zu diesen repetitiven DNA-Abschnitten gehören mobile Elemente, die aufgrund ihrer Fähigkeit, sich im gesamten Genom zu replizieren, auch als „springende Gene“ bezeichnet werden. Forscher entdeckten, dass unter den Tausenden von mobilen Elementen im menschlichen Genom die meisten Keimbahnmutagenesen auf die Aktivität einiger Dutzend hochaktiver Elemente zurückzuführen sind.
So wurde beispielsweise festgestellt, dass ein besonders überaktives LINE-1-Element einen leistungsstarken regulatorischen Schalter kaperte, um deutlich mehr Kopien von sich selbst als üblich zu produzieren und so zusätzliches genetisches Material in die DNA vieler Menschen zu streuen. Forscher beobachteten einen ähnlichen Trick bei einer anderen Klasse springender Gene, den sogenannten SVAs.
„Unsere Arbeit zeigt, wie mobile Elemente ihre Aktivität steigern, indem sie unsere genomischen Regulationskontrollen kapern, eine unterschätzte Strategie, die zur Entwicklung von Krankheiten wie Krebs beitragen könnte und weitere Untersuchungen verdient“, sagt Dr. Rodríguez-Martín.
Für die zweite Arbeit, die gemeinsam vom Europäischen Laboratorium für Molekularbiologie (EMBL) und der Heinrich-Heine-Universität Düsseldorf (HHU) geleitet wurde, wurde ein viel kleinerer Probensatz von nur 65 Personen verwendet, aber mehrere leistungsfähige Sequenzierungsmethoden kombiniert, um menschliche Genome in beispiellosem Detailgrad zu rekonstruieren .
Dieser Ansatz half den Forschern, die am schwierigsten zu lesenden Abschnitte, einschließlich der Zentromere, zu entschlüsseln. Die nahezu vollständigen, lückenlosen Anordnungen jedes Chromosoms dieser Individuen ermöglichten es den Forschern, große genetische Varianten in Regionen zu entdecken, die im ersten Artikel oder in anderen Studien nicht entdeckt worden waren.
Die Ergebnisse zeigen, dass die Kombination des Ansatzes der ersten Arbeit, bei der viele Genome bis zu einer bescheidenen Tiefe sequenziert wurden, mit dem Ansatz der zweiten Arbeit, bei der einige Genome sehr detailliert sequenziert wurden, der schnellste Weg zu einer vollständigen und umfassenden Karte der genetischen Vielfalt des Menschen ist.
„Eine Studie nutzte eine geringere Sequenzierleistung, aber eine viel größere Kohorte. Die andere nutzte eine kleinere Kohorte, aber eine viel höhere Sequenzierleistung pro Probe. Dies führte zu ergänzenden Schlussfolgerungen“, bemerkt Dr. Jan Korbel, Gruppenleiter und Interimsdirektor des EMBL Heidelberg sowie Co-Autor beider Studien.
In beiden Arbeiten wurden Individuen des 1000-Genome-Projekts, der wegweisenden Initiative zur Kartierung der globalen genetischen Vielfalt im Jahr 2015, neu sequenziert. Das Projekt basierte auf der „Short-Read“-Sequenzierungstechnologie , die jeweils nur sehr kleine DNA-Fragmente lesen konnte. Diese Fragmente waren zu kurz, um große Teile fehlender oder kopierter DNA, lange Abschnitte mit Richtungswechsel oder an vielen Stellen nahezu identisch erscheinende Wiederholungen aufzudecken.
Die in den neuen Studien erzielten Fortschritte wurden durch die „Long-Read“-Sequenzierung ermöglicht, eine neue Technologie, die Tausende oder Zehntausende von DNA-Buchstaben gleichzeitig liest und den Forschern dabei hilft, große Mengen versteckter Variationen zu finden, die mit früheren Methoden nicht nachweisbar waren.
Beide Artikel stellen zudem wichtige Fortschritte bei der Erstellung eines Referenz-Pangenoms dar. In den letzten zwanzig Jahren verwendeten Wissenschaftler die DNA-Sequenz eines Individuums als Standardgenom des Menschen. Das Pangenom wäre jedoch für die personalisierte Medizin nützlicher, da es die globale Vielfalt abbilden würde.
Durch die Entwicklung innovativer Algorithmen, die 1.019 verschiedene Genome in der Breite und 65 ultravollständige Genome in der Tiefe analysieren können, liefern die Forscher einen Fahrplan, der die Möglichkeit eines echten menschlichen Pangenoms eher praktikabel als erstrebenswert macht, insbesondere da die Kosten für die Sequenzierung langer Leseabschnitte sinken.
„Dank dieser Studien haben wir eine umfassende und medizinisch relevante Ressource geschaffen , die nun von Forschern weltweit genutzt werden kann, um den Ursprung der menschlichen Genomvariation und deren Einfluss auf eine Vielzahl von Faktoren besser zu verstehen“, sagt Tobias Marschall, Professor an der Heinrich-Heine-Universität Düsseldorf und Co-Autor beider Studien. „Dies ist ein hervorragendes Beispiel für kollaborative Forschung, die neue Perspektiven in der Genomforschung eröffnet und einen Schritt hin zu einem vollständigeren menschlichen Pangenom darstellt“, so Marschall abschließend.
abc