Na Genera, acreditamos que o conhecimento sobre a saúde é transformador, e entender os impactos do seu DNA sobre ela é um dos melhores caminhos para isso. A fim de te ajudarmos nessa jornada, desenvolvemos este material explicativo para que você possa, além de descobrir mais sobre a sua genética, entender como nossas análises e metodologias funcionam. Para chegarmos aos resultados, analisamos milhares de regiões do DNA.
Parte I – O que procuramos?
O DNA (sigla em inglês para “ácido desoxirribonucleico”) está presente em quase todas as células do corpo e contém as informações genéticas que nos definem. É o DNA o responsável por determinar nossas características físicas, como altura, cor dos olhos e cabelos, controlar o metabolismo, funcionamento dos órgãos, predisposição a doenças e até traços de personalidade. Cada pessoa recebe metade do seu DNA da mãe e a outra metade do pai.
Ao longo das gerações, determinadas regiões do DNA sofrem mutações, podendo ser utilizadas como marcadores genéticos. Na Escala de Risco Genético, analisamos os SNPs (sigla em inglês para “Polimorfismo de Nucleotídeo único”). Esses marcadores são variações em uma única base de nucleotídeo na sequência do DNA, representadas pelas letras A, T, C ou G. Por exemplo, uma pessoa pode ter a sequência ATTC, enquanto outra tem AGTC. Essa troca da letra T pela letra G é um SNP.
Embora existam doenças monogênicas (causadas por mutações em um único gene), como a Hemocromatose hereditária, a maioria das condições são influenciadas por uma combinação de vários genes. Nesses casos, a análise de SNPs em diferentes regiões do DNA permite um cálculo mais preciso e assertivo.
Parte II – Como é feito o cálculo?
2.1 – Base da análise
Os Estudos Genômicos de Associação (do inglês, Genome Wide Association Studies, ou GWAS) são uma extensa área de investigação na qual o DNA de milhares de voluntários é analisado para encontrar padrões relacionados com características específicas do estudo, por exemplo, a Doença de Alzheimer. O processo envolve a comparação do genoma de pessoas afetadas e não afetadas pela característica estudada, com o objetivo de identificar variantes que estejam significativamente mais presentes em um dos grupos. Ao final do estudo, o impacto dessas variantes, chamado de “tamanho de efeito”, é calculado e cada uma delas é proposta como fator de risco ou proteção contra a doença.
Após o processamento da sua amostra, seguimos o padrão estabelecido pelo GWAS e procuramos em seus dados as variantes especificas de cada doença analisada. Em geral, cada variante tem um pequeno impacto, mas ao considerar dezenas ou centenas delas, o poder preditivo do cálculo aumenta.
2.2 – Processamento
Mais especificamente, o processamento da amostra pode ser dividido nas etapas de faseamento, imputação e cálculo do risco.
O faseamento é o processo de identificação da origem genética paterna ou materna dos alelos. Esta etapa é mais simples quando a genotipagem é feita com o trio familiar: mãe, pai e filho. No entanto, também é possível estimar a origem através de métodos estatísticos.
Após o faseamento, inicia-se a etapa de imputação, que utiliza a sequência de alelos adquiridas da amostra como base para estimar as posições especificas do genoma que não foram diretamente genotipadas. Podemos comparar a imputação a um jogo de forca: imagine a palavra “G – E – N – É – _ – I – C – A”. Baseando-se nas letras anteriores e posteriores, deduzimos que a letra ausente é “T”, formando “GENÉTICA”. Assim, a imputação depende do faseamento, pois a origem dos alelos é fundamental para estimar os outros genótipos.
Além disso, para garantir a melhora no processo de faseamento e imputação, utilizamos um “painel de referência”, que contém amostras com origens conhecidas e variantes nas posições de interesse para imputação. O painel inclui amostras com diferentes ancestralidades, que são representativas para a população analisada.
Depois de adquirir as informações de quantas e quais variantes estão no seu DNA, juntamente com o tamanho do efeito de cada uma delas, utilizamos modelos matemáticos que unem essas informações em um único número. Adicionalmente, esse valor de risco é ajustado por machine learning conforme a análise de ancestralidade de cada amostra. Ou seja, é realizado um ajuste do risco calculado das variáveis, garantindo que os resultados reflitam de maneira adequada a ancestralidade global.
O valor de risco é então comparado com as médias do nosso banco de dados e com as estatísticas de incidência das doenças na população, para enfim chegar ao resultado final de risco, que é mostrado na página de resultados.
2.3 – Resultados
Os resultados indicam o risco absoluto e o risco relativo. O primeiro apresenta o risco independente da comparação com qualquer outro grupo, através de arquivos de incidência que indicam o risco pela faixa de idade. Já o segundo, é o risco de um indivíduo em relação a um banco de dados. A ferramenta de cálculo para risco absoluto foi desenvolvida pela equipe de Pesquisa e Desenvolvimento da Genera.
Parte III – E os meus dados?
Tão importante quanto entender como desenvolvemos nossos métodos e chegamos aos resultados da Escala de Risco Genético, é entender como cuidamos de seus dados. Na Genera, a segurança dos seus dados é de extrema importância e buscamos ser transparentes em relação a isso. Suas informações genéticas são mantidas em nossos bancos de dados de forma segura. Nenhum acesso exterior a elas é permitido e não há nenhuma comercialização a terceiros das mesmas. Nossa política de privacidade, ponto a ponto, pode ser acessada aqui.
É importante ressaltar que apenas clientes que tiveram seus resultados processados após a implementação da nova metodologia terão acesso aos novos resultados do painel Escala de Risco Genético.
Referências e leituras adicionais
- LI, Yun et al. Genotype imputation. Annual review of genomics and human genetics, v. 10, n. 1, p. 387-406, 2009. https://doi.org/10.1146/annurev.genom.9.081307.164242.
- CHOUDHURY, Parichoy et al. ICARE: an R package to build, validate and apply absolute risk models. Plos One, [S.L.], v. 15, n. 2, p. e0228198, 5 fev. 2020. Public Library of Science (PLoS). http://dx.doi.org/10.1371/journal.pone.0228198.
- MARNETTO, Davide et al. Ancestry deconvolution and partial polygenic score can improve susceptibility predictions in recently admixed individuals. Nature Communications, [S.L.], v. 11, n. 1, p. 1628, 2 abr. 2020. Springer Science and Business Media LLC. http://dx.doi.org/10.1038/s41467-020-15464-w