A visão mais abrangente do genoma humano até o momento acelerará o diagnóstico de doenças raras e câncer.
Pesquisadores espanhóis do Centro de Regulação Genômica participaram da criação do catálogo de variações genéticas mais completo até o momento, decifrando algumas das regiões mais difíceis de identificar e negligenciadas do genoma humano . Esta descoberta, publicada nesta quarta-feira em dois artigos na revista Nature, acelerará o diagnóstico de doenças raras e câncer .
"Cada genoma humano possui cerca de 25.000 variantes estruturais, mas apenas uma causa doenças, por isso é necessário estreitar o espaço de busca e rastrear variantes. Com as referências atuais, podemos ir de 25.000 a alguns milhares, mas isso ainda é procurar uma agulha no palheiro. Graças a esta nova referência que estamos divulgando com este trabalho , estreitamos o espaço de busca para menos de 200 variantes candidatas , o que facilita muito o diagnóstico genético na prática clínica", explicou o Dr. Bernardo Rodríguez-Martín, coautor correspondente do estudo, durante a coletiva de imprensa de apresentação dos resultados.
"Este trabalho constitui a referência mais abrangente sobre variação genética estrutural no genoma humano até o momento. É um avanço em direção à medicina personalizada baseada em informações genômicas", acrescentou. O especialista afirmou que hospitais como o Sant Joan de Deu, que colabora com o CGR, já utilizam essas tecnologias para diagnosticar doenças raras em crianças.
Além disso, essas novas tecnologias podem ser aplicadas ao estudo de mutações que causam câncer . "Em 15% dos pacientes, não é encontrada uma mutação causadora de câncer, e isso pode ocorrer porque as tecnologias anteriores não conseguiram detectá-la. Outro grande desafio é entender as mutações que se acumulam ao longo de nossas vidas. Essa tecnologia nos permite entender como acumulamos mutações à medida que envelhecemos e devido a fatores ambientais e de estilo de vida, com uma resolução sem precedentes", acrescenta o pesquisador, que reconhece que uma das limitações é o custo ainda alto do sequenciamento. " Sequenciar um genoma custa mil euros . Nos últimos cinco anos, caiu significativamente, cerca de cinco vezes, então podemos imaginar um futuro não tão distante, em cerca de cinco anos, em que o preço terá caído o suficiente e, por algumas centenas de euros, poderemos sequenciar um genoma com essa tecnologia", conclui.
Em 2003, o genoma humano foi sequenciado pela primeira vez. Descobriu-se então que 60% do genoma é composto por DNA repetitivo, mas os 8% restantes permaneceram sem solução devido à sua complexidade. Em 2015, o projeto 1000 Genomas sequenciou mais de 1.000 genomas humanos em 26 populações ao redor do mundo, mas as limitações dessas tecnologias, capazes de ler DNA apenas em fragmentos muito curtos, deixaram grandes regiões do genoma inexploradas. Entre 2021 e 2023, todo o genoma humano será resolvido graças à tecnologia de leitura longa, mas em uma única referência, e o projeto Pangenome surge para ampliar o número de referências, com 47 indivíduos de 5 continentes.
Agora, pesquisadores expandiram significativamente o catálogo de variações genéticas humanas conhecidas. Os conjuntos de dados resultantes, publicados nesta quarta-feira na Nature, constituem a visão geral mais abrangente do genoma humano até o momento . O primeiro artigo, liderado conjuntamente pelo Laboratório Europeu de Biologia Molecular (EMBL), a Universidade Heinrich Heine de Düsseldorf (HHU) e o Centro de Regulação Genômica (CRG) de Barcelona, analisou os genomas de 1.019 indivíduos de 26 populações em cinco continentes.
Os pesquisadores procuraram especificamente por variantes estruturais no genoma humano. Trata-se de grandes fragmentos de DNA que foram deletados, duplicados, inseridos, invertidos ou rearranjados. As diferenças nas variantes estruturais entre indivíduos podem envolver alterações em milhares de letras do DNA de uma só vez, muitas vezes eliminando genes e levando ao desenvolvimento de muitas doenças raras e cânceres.
A equipe encontrou e categorizou mais de 167.000 variantes estruturais nos 1.019 indivíduos , dobrando a quantidade conhecida de variação estrutural no pangenoma humano, um parâmetro que conecta o DNA de muitas pessoas em vez de depender de um único genoma. Cada pessoa carregava uma mediana de 7,5 milhões de letras de alterações estruturais, destacando a vasta quantidade de edições genômicas que a natureza realiza por conta própria.
“Encontramos um tesouro de variação genética oculta nessas populações, muitas das quais estavam sub-representadas em conjuntos de referência anteriores. Por exemplo, 50,9% das inserções e 14,5% das deleções que encontramos não haviam sido relatadas em catálogos de variação anteriores. Este é um passo importante para mapear pontos cegos no genoma humano e reduzir o viés que há muito favorece genomas de ascendência europeia, além de abrir caminho para terapias e testes que funcionam igualmente bem em pessoas ao redor do mundo”, afirma o Dr. Bernardo Rodríguez-Martín.
Aproximadamente três em cada cinco (59%) das variantes descobertas ocorreram em menos de um por cento dos indivíduos, um nível crucial de raridade para o diagnóstico de doenças genéticas, pois pode ajudar a filtrar variações inofensivas com mais eficácia . Em testes, o novo conjunto de referência reduz a lista de mutações suspeitas de dezenas de milhares para apenas algumas centenas, acelerando o diagnóstico de síndromes genéticas raras e outros tipos de doenças, como o câncer.
Bernardo Rodríguez-Martín começou a trabalhar no projeto no laboratório de Jan Korbel no EMBL e o concluiu após se mudar para o CRG para fundar seu próprio grupo. Ele desenvolveu o SVAN, um software que categoriza cada alteração no DNA como um "pedaço extra copiado" ou um "fragmento excluído", ajudando a equipe a analisar os dados genéticos para identificar novos padrões.
O SVAN revelou que mais da metade da diversidade recém-mapeada no genoma humano está localizada em segmentos de DNA altamente repetitivos — partes do genoma anteriormente consideradas lixo ou muito difíceis de estudar. "Elementos repetitivos representam um rico e até então ignorado reservatório de diversidade genética. Eles são atores-chave na diversidade humana, nas doenças e na evolução", afirma Emiliano Sotelo-Fonseca, aluno de doutorado do CRG e coautor do primeiro estudo.
Esses segmentos repetitivos de DNA incluem elementos móveis, também conhecidos como "genes saltadores" devido à sua capacidade de se replicar por todo o genoma. Pesquisadores descobriram que, entre os milhares de elementos móveis no genoma humano, a maior parte da mutagênese da linha germinativa resulta da atividade de algumas dezenas de elementos altamente ativos.
Por exemplo, descobriu-se que um elemento LINE-1 particularmente hiperativo sequestrava um poderoso interruptor regulador para produzir muito mais cópias de si mesmo do que o normal, espalhando material genético extra no DNA de muitas pessoas. Pesquisadores observaram um truque semelhante com outra classe de genes saltadores, chamados SVAs.
"Nosso trabalho mostra como elementos móveis aumentam sua atividade ao sequestrar nossos controles regulatórios genômicos, uma estratégia subestimada que pode contribuir para o desenvolvimento de doenças como o câncer e merece mais investigação", diz o Dr. Rodríguez-Martín.
O segundo artigo, liderado conjuntamente pelo Laboratório Europeu de Biologia Molecular (EMBL) e pela Universidade Heinrich Heine de Düsseldorf (HHU), usou um conjunto de amostras muito menor, de apenas 65 indivíduos, mas combinou vários métodos poderosos de sequenciamento para reconstruir genomas humanos com detalhes sem precedentes .
Essa abordagem ajudou os pesquisadores a decodificar as seções mais difíceis de ler, incluindo os centrômeros. As montagens quase completas e sem lacunas de cada cromossomo desses indivíduos permitiram que os pesquisadores detectassem grandes variantes genéticas em regiões que não haviam sido detectadas no primeiro artigo ou em outros estudos.
Os resultados mostram que combinar a abordagem do primeiro artigo, com muitos genomas sequenciados em uma profundidade modesta, com a abordagem do segundo artigo, com alguns genomas em grande detalhe, é o caminho mais rápido para um mapa completo e inclusivo da diversidade genética humana .
"Um estudo utiliza menor poder de sequenciamento, mas uma coorte muito maior. O outro utiliza uma coorte menor, mas muito mais poder de sequenciamento por amostra. Isso levou a conclusões complementares", observa o Dr. Jan Korbel, líder do grupo e diretor interino do EMBL Heidelberg, e coautor sênior de ambos os estudos.
Ambos os artigos resequenciaram indivíduos do Projeto 1000 Genomas, a iniciativa histórica que mapeou a diversidade genética global em 2015. O projeto utilizou a tecnologia de sequenciamento de "leitura curta" , que conseguia ler apenas fragmentos muito pequenos de DNA por vez. Esses fragmentos eram curtos demais para revelar grandes pedaços de DNA ausentes ou copiados, longos trechos que mudam de direção ou repetições que parecem quase idênticas em muitos lugares.
Os avanços feitos nos novos estudos foram possíveis graças ao sequenciamento de "leitura longa" , uma nova tecnologia que lê milhares ou dezenas de milhares de letras de DNA por vez, ajudando os pesquisadores a encontrar grandes quantidades de variações ocultas indetectáveis com métodos anteriores.
Ambos os artigos também representam avanços importantes na construção de um pangenoma humano de referência. Nos últimos vinte anos, cientistas têm usado a sequência de DNA de um indivíduo como genoma humano padrão, mas o pangenoma seria mais útil para a medicina personalizada, pois refletiria a diversidade global.
Ao desenvolver algoritmos inovadores que podem analisar 1.019 genomas diversos em amplitude e 65 genomas ultracompletos em profundidade, os pesquisadores fornecem um roteiro que torna a possibilidade de um verdadeiro pangenoma humano mais prática do que mera aspiração, especialmente porque os custos do sequenciamento de leitura longa estão diminuindo.
"Graças a esses estudos, criamos um recurso abrangente e clinicamente relevante que agora pode ser usado por pesquisadores do mundo todo para entender melhor a origem da variação genômica humana e como ela é afetada por uma ampla variedade de fatores", afirma Tobias Marschall, professor da Universidade Heinrich Heine de Düsseldorf e coautor sênior de ambos os estudos. "Este é um excelente exemplo de pesquisa colaborativa que abre novas perspectivas na ciência genômica e é um passo em direção a um pangenoma humano mais completo", conclui.
abc