Najbardziej kompleksowy jak dotąd obraz ludzkiego genomu przyspieszy diagnostykę rzadkich chorób i nowotworów.
Hiszpańscy naukowcy z Centrum Regulacji Genomicznej uczestniczyli w tworzeniu najobszerniejszego jak dotąd katalogu wariantów genetycznych, rozszyfrowując niektóre z najtrudniejszych do zidentyfikowania i pomijanych regionów ludzkiego genomu . To przełomowe odkrycie, opublikowane w tę środę w dwóch artykułach w czasopiśmie „Nature”, przyspieszy diagnostykę rzadkich chorób i nowotworów .
„Każdy ludzki genom ma około 25 000 wariantów strukturalnych, ale tylko jeden powoduje chorobę, dlatego konieczne jest zawężenie przestrzeni poszukiwań i przeszukiwanie jej pod kątem wariantów. Przy obecnych publikacjach możemy przejść z 25 000 do kilku tysięcy, ale to wciąż szukanie igły w stogu siana. Dzięki nowym referencjom, które publikujemy w ramach tej pracy , zawęziliśmy przestrzeń poszukiwań do mniej niż 200 wariantów kandydackich , co znacznie ułatwia diagnostykę genetyczną w praktyce klinicznej” – wyjaśnił dr Bernardo Rodríguez-Martín, współautor korespondencyjny badania, podczas konferencji prasowej prezentującej wyniki.
„Ta praca stanowi jak dotąd najbardziej kompleksowe odniesienie do strukturalnej zmienności genetycznej w ludzkim genomie. To krok naprzód w kierunku medycyny spersonalizowanej opartej na informacjach genomicznych” – dodał. Ekspert stwierdził, że szpitale takie jak Sant Joan de Deu, który współpracuje z CGR, już wykorzystują te technologie do diagnozowania rzadkich chorób u dzieci.
Co więcej, te nowe technologie można zastosować do badania mutacji powodujących raka . „U 15% pacjentów nie stwierdza się mutacji powodującej raka, co może wynikać z faktu, że poprzednie technologie nie były w stanie jej wykryć. Kolejnym poważnym wyzwaniem jest zrozumienie mutacji, które kumulują się w ciągu naszego życia. Ta technologia pozwala nam zrozumieć, w jaki sposób kumulują się mutacje wraz z wiekiem oraz pod wpływem czynników środowiskowych i stylu życia, z niespotykaną dotąd precyzją” – dodaje badacz, który przyznaje, że jednym z ograniczeń jest wciąż wysoki koszt sekwencjonowania. „ Sekwencjonowanie genomu kosztuje tysiąc euro . W ciągu ostatnich pięciu lat cena ta znacząco spadła, około pięciokrotnie, więc możemy sobie wyobrazić niedaleką przyszłość, za około pięć lat, gdy cena spadnie na tyle, że za kilkaset euro będziemy mogli zsekwencjonować genom za pomocą tej technologii” – podsumowuje.
W 2003 roku po raz pierwszy zsekwencjonowano ludzki genom. Odkryto wówczas, że 60% genomu to powtarzalne DNA, ale pozostałe 8% pozostało nierozpoznane ze względu na swoją złożoność. W 2015 roku w ramach projektu „1000 Genomes” zsekwencjonowano ponad 1000 ludzkich genomów w 26 populacjach na całym świecie, ale ograniczenia tych technologii, umożliwiających odczyt DNA jedynie z bardzo krótkich fragmentów, pozostawiły duże obszary genomu niezbadane. W latach 2021–2023 cały ludzki genom zostanie zsekwencjonowany dzięki technologii długiego odczytu, ale w ramach jednego odniesienia, a projekt Pangenome rozszerzy liczbę odniesień, obejmując 47 osób z 5 kontynentów.
Naukowcy znacząco poszerzyli katalog znanej zmienności genetycznej człowieka. Powstałe w ten sposób zbiory danych, opublikowane w tę środę w czasopiśmie Nature, stanowią jak dotąd najbardziej kompleksowy przegląd ludzkiego genomu . Pierwszy artykuł, opracowany wspólnie przez Europejskie Laboratorium Biologii Molekularnej (EMBL), Uniwersytet Heinricha Heinego w Düsseldorfie (HHU) oraz Centrum Regulacji Genomicznej (CRG) w Barcelonie, analizował genomy 1019 osób z 26 populacji na pięciu kontynentach.
Naukowcy poszukiwali wariantów strukturalnych w ludzkim genomie. Są to duże fragmenty DNA, które uległy usunięciu, duplikacji, insercji, inwersji lub rearanżacji. Różnice w wariantach strukturalnych między poszczególnymi osobami mogą obejmować zmiany w tysiącach liter DNA jednocześnie, często prowadząc do eliminacji genów i rozwoju wielu rzadkich chorób i nowotworów.
Zespół odkrył i skategoryzował ponad 167 000 wariantów strukturalnych u 1019 osób , podwajając znaną liczbę zmienności strukturalnych w ludzkim pangenomie – punkt odniesienia łączący DNA wielu osób, a nie opierający się na pojedynczym genomie. Każda osoba miała średnio 7,5 miliona liter zmian strukturalnych, co podkreśla ogrom edycji genomu, jaką natura przeprowadza sama.
„Odkryliśmy prawdziwą kopalnię ukrytej zmienności genetycznej w tych populacjach, z których wiele było niedostatecznie reprezentowanych w poprzednich zestawach referencyjnych. Na przykład, 50,9% insercji i 14,5% delecji, które znaleźliśmy, nie zostało odnotowanych w poprzednich katalogach zmienności. To ważny krok w kierunku zmapowania martwych punktów w ludzkim genomie i zmniejszenia uprzedzeń, które od dawna faworyzowały genomy pochodzenia europejskiego, a także toruje drogę terapiom i testom, które działają równie skutecznie u ludzi na całym świecie” – mówi dr Bernardo Rodríguez-Martín.
Około trzy na pięć (59%) odkrytych wariantów wystąpiło u mniej niż jednego procenta osób, co stanowi kluczowy poziom rzadkości w diagnostyce chorób genetycznych, ponieważ pozwala skuteczniej odfiltrować nieszkodliwe warianty . W testach, nowy zestaw referencyjny zmniejsza listę podejrzewanych mutacji z dziesiątek tysięcy do zaledwie kilkuset, przyspieszając diagnostykę rzadkich zespołów genetycznych i innych rodzajów chorób, takich jak nowotwory.
Bernardo Rodríguez-Martín rozpoczął pracę nad projektem w laboratorium Jana Korbela w EMBL i ukończył go po przeniesieniu się do CRG, gdzie założył własną grupę. Opracował SVAN, program komputerowy, który klasyfikuje każdą zmianę DNA jako „dodatkowy skopiowany fragment” lub „usunięty fragment”, pomagając zespołowi analizować dane genetyczne w celu identyfikacji nowych wzorców.
SVAN ujawnił, że ponad połowa nowo zmapowanej różnorodności w ludzkim genomie znajduje się w wysoce powtarzalnych segmentach DNA – częściach genomu, które wcześniej uważano za śmieci lub za zbyt trudne do zbadania. „Powtarzalne elementy stanowią bogate, a wcześniej ignorowane źródło różnorodności genetycznej. Odgrywają one kluczową rolę w różnorodności, chorobach i ewolucji człowieka” – mówi Emiliano Sotelo-Fonseca, doktorant CRG i współautor pierwszego badania.
Te powtarzalne segmenty DNA zawierają elementy ruchome, zwane również „genami skaczącymi” ze względu na ich zdolność do replikacji w całym genomie. Naukowcy odkryli, że spośród tysięcy elementów ruchomych w ludzkim genomie, większość mutagenezy linii zarodkowej wynika z aktywności kilkudziesięciu wysoce aktywnych elementów.
Na przykład, odkryto, że jeden szczególnie nadaktywny element LINE-1 przejął kontrolę nad potężnym przełącznikiem regulacyjnym, aby wyprodukować o wiele więcej kopii samego siebie niż zwykle, rozpraszając dodatkowy materiał genetyczny w DNA wielu osób. Naukowcy zaobserwowali podobny trik w przypadku innej klasy skaczących genów, zwanych SVA.
„Nasza praca pokazuje, jak elementy mobilne zwiększają swoją aktywność, przejmując kontrolę nad naszymi genomowymi mechanizmami regulacyjnymi. To niedoceniana strategia, która może przyczyniać się do rozwoju chorób takich jak rak i wymaga dalszych badań” – mówi dr Rodríguez-Martín.
W drugim artykule, którego współautorami byli Europejskie Laboratorium Biologii Molekularnej (EMBL) i Uniwersytet Heinricha Heinego w Düsseldorfie (HHU), wykorzystano znacznie mniejszą próbę składającą się z zaledwie 65 osób, ale połączono w nim kilka skutecznych metod sekwencjonowania, co pozwoliło na rekonstrukcję genomu ludzkiego z niespotykaną dotąd szczegółowością .
To podejście pomogło badaczom zdekodować najtrudniejsze do odczytania fragmenty, w tym centromery. Niemal kompletne, pozbawione luk struktury każdego chromosomu pochodzące od tych osobników pozwoliły badaczom wykryć duże warianty genetyczne w regionach, które nie zostały wykryte w pierwszym artykule ani w innych badaniach.
Wyniki pokazują, że połączenie podejścia zastosowanego w pierwszej pracy, obejmującego sekwencjonowanie wielu genomów na niewielką głębokość, z podejściem zastosowanym w drugiej pracy, obejmującej sekwencjonowanie niewielu genomów z dużą szczegółowością, jest najszybszą drogą do uzyskania kompletnej i całościowej mapy różnorodności genetycznej człowieka .
„Jedno badanie wykorzystuje mniejszą moc sekwencjonowania, ale znacznie większą kohortę. Drugie wykorzystuje mniejszą kohortę, ale znacznie większą moc sekwencjonowania na próbkę. Doprowadziło to do uzupełniających się wniosków” – zauważa dr Jan Korbel, kierownik grupy i tymczasowy dyrektor EMBL Heidelberg oraz współautor obu badań.
W obu artykułach dokonano resekwencjonowania osobników z Projektu 1000 Genomów, przełomowej inicjatywy, która w 2015 roku zmapowała globalną różnorodność genetyczną. Projekt opierał się na technologii sekwencjonowania „krótkiego odczytu” , która pozwalała na odczytywanie tylko bardzo małych fragmentów DNA na raz. Fragmenty te były zbyt krótkie, aby ujawnić duże fragmenty brakującego lub skopiowanego DNA, długie odcinki zmieniające kierunek lub powtórzenia, które w wielu miejscach wydają się niemal identyczne.
Postępy w nowych badaniach stały się możliwe dzięki sekwencjonowaniu „długiego odczytu” , nowej technologii odczytującej tysiące lub dziesiątki tysięcy liter DNA na raz, co pomaga naukowcom znaleźć dużą ilość ukrytych zmienności niewykrywalnych za pomocą poprzednich metod.
Oba artykuły stanowią również istotny postęp w konstrukcji referencyjnego ludzkiego pangenomu. Przez ostatnie dwadzieścia lat naukowcy wykorzystywali sekwencję DNA danej osoby jako standardowy genom ludzki, ale pangenom byłby bardziej przydatny w medycynie spersonalizowanej, ponieważ odzwierciedlałby globalną różnorodność.
Opracowując innowacyjne algorytmy, które umożliwiają analizę 1019 zróżnicowanych genomów wszerz i 65 ultrakompletnych genomów wszerz, naukowcy opracowują plan działania, który sprawia, że możliwość stworzenia prawdziwego ludzkiego pangenomu staje się bardziej praktyczna niż jedynie marzeniem, zwłaszcza że koszty sekwencjonowania długich odczytów maleją.
„Dzięki tym badaniom stworzyliśmy kompleksowe i istotne z medycznego punktu widzenia źródło , z którego mogą teraz korzystać naukowcy na całym świecie, aby lepiej zrozumieć pochodzenie zmienności genomu ludzkiego i wpływ na nią wielu różnych czynników” – mówi Tobias Marschall, profesor Uniwersytetu Heinricha Heinego w Düsseldorfie i współautor obu badań. „To doskonały przykład wspólnych badań, które otwierają nowe perspektywy w nauce genomiki i stanowią krok w kierunku pełniejszego ludzkiego pangenomu” – podsumowuje.
abc