Genealogia genética
andrelas
Beta
Devido a perguntas feitas neste tópico, e para evitar postar mensagens off-topic por lá, criei este tópico aqui. Ele tem relação MUITO TÊNUE com cidadania. Portanto, se você não tem interesse em genealogia por si e, em especial, em genealogia genética, possivelmente não se interessará por este post.
Adianto que tudo o que vou escrever abaixo é a minha OPINIÃO. Marco o @Chrieso (que fez a pergunta no outro tópico) e o @marcelloamr (que deu sua opinião), mas obviamente o tópico está aberto a qualquer forista que queira contribuir.
@Chrieso , respondendo à sua pergunta no outro tópico:
Os testes "family Finder" são focados em comparar trechos do seu DNA com trechos de todas as outras pessoas que ou fizeram testes com a mesma empresa, ou fizeram upload dos seus "raw data" (dados crus, ou o DNA lido em outra plataforma, do qual fizeram download após o teste). O processo é:
- Você adquire o teste
- Eles enviam para o seu endereço um kit com um ou mais tubos e "cotonetes", para que você raspe o cotonete nas bochechas, coloque no tubo, e envie de volta para eles
- Recebendo o cotonete, eles fazem a leitura do DNA e processam os dados (demora de 30 a 60 dias, a depender de diversos fatores)
- Uma vez que os dados foram processados, você pode verificar, na interface do site em questão, os seus "matches" genealógicos
- Além dos matches, cada site dá (gratuitamente ou mediante pagamentos extras) informações adicionais como a origem antiga do seu DNA, relatórios de "riscos genéticos de saúde", etc
Focando nos matches: basicamente, eles comparam trechos de seu DNA com os trechos dos outros usuários do site, procurando por "pedaços" que correspondam. Estes pedaços, quanto maiores forem, mais "garantidos" são de ser um parentesco real. Há um limiar a partir do qual o parentesco é certo (100%), e mais do que isso, há tabelas que mostram que "tamanhos" de correspondência correspondem, probabilisticamente, a cada nível de parentesco. Por exemplo, no site DNA Painter temos o gráfico abaixo:
"Você" (a pessoa que fez o teste) está naquele retângulo branco onde está escrito "SELF". Cada um dos outros retângulos mostra um número, expresso em "centimorgans" (ou cM, unidade de medida que expressa a ligação genética). Se você fosse comparado com um "clone" perfeito seu, isso daria cerca de 6800 a 7400 cM, a depender da empresa, dos erros de leitura de trechos específicos, etc.
Destes cerca de 7000 cM, metade vem do seu pai, e metade da sua mãe (através da combinação genética entre os DNAs no momento da fecundação do óvulo pelo espermatozoide). Assim sendo, espera-se que um pai/mãe e um filho/filha compartilhem cerca de 3500 cM, mas ISSO PODE VARIAR de acordo com uma série de fatores. Além disso, o pai e a mãe TAMBÉM podem compartilhar pequenos trechos de DNA, ainda que não sejam parentes próximos. Assim, como você pode ver na tabela acima, a faixa para que você tenha uma "quase-certeza" (estamos falando de estatísticas) de que um match é seu pai ou sua mãe varia entre 2376 (mínimo) e 3720 (máximo), sendo que o "centro da meta", ou o número mais próximo da média, é de 3485 cM.
Já para irmãos de pai E mãe, espera-se que este número esteja em torno de 2613 cM, podendo variar entre 1613 e 3488 cM. Já um meio-irmão está perto de 1759 cM, podendo variar de 1160 cM a 2436 cM. Um primo em primeiro grau varia de 396 a 1397 cM, etc.
Você já deve ter reparado que existe sobreposição de números... Por exemplo, uma pessoa que tenha um match de 1300 cM com você pode, pela tabela acima, tanto ser um meio-irmão quanto um primo. Isso acontece porque o DNA de dois irmãos nunca é igual (exceto se forem gêmeos univitelinos) e, na distribuição do DNA, você pode pegar trechos que seu irmão/irmã também pegou, ou trechos distintos. O mesmo ocorre com os primos, sendo que no caso deles já há a diferença entre seu pai/mãe e seu tio/tia na "distribuição" do DNA dos seus avós e, depois, há o fato de que apenas um dos ascendentes de cada um de vocês é parente, ou seja, apenas METADE do DNA de vocês veio do mesmo "lugar" e, por isso, a combinação vai ficando probabilisticamente mais distante.
É por isso que, como você pode ver na tabela, quanto mais "distante" o parentesco, menores são as faixas de DNA compartilhados, e maiores são as faixas, percentualmente falando, nas quais esses parentescos podem ocorrer.
Por exemplo, a diferença entre o número mínimo e o máximo de cM para se acreditarq eu alguém é seu pai/mãe é de cerca de 505, mas para um primo em segundo grau é de 1400% (!), porque a cada recombinação de DNA a "loteria" torna menos previsível saber quanto do DNA do parente em comum será compartilhado, ao menos em "pedaços" que sejam significativos para inferir um parentesco.
Também por isso, há faixas a partir da qual a coincidência de DNA passa a poder ser uma simples coincidência de população, ou seja, não significa mais que haja um "parentesco" no sentido de descendência não longínqua. Para a maioria dos genealogistas, abaixo de 7 cM de match o parentesco passa a ser de baixa confiabilidade (pode ser só uma coincidência), e entre 7 cM e 10 cM é de média confiabilidade (pode ser coincidência, mas provavelmente não é). Entretanto, um match destes, ou mesmo um pouco maior como 15cM, é um match MUITO distante, e a não ser que ambas as pessoas já tenham desenvolvido sua árvore genealógica por muitas gerações e consigam encontrar o ascendente comum, não servirá de muita coisa.
Outra questão é o match ser formado de diversos "pedaços" separados, ou de um grande pedaço. Por exemplo, uma pessoa com 40 cM de match com você em um só segmento é, PROVAVELMENTE, um match mais próximo e confiável do que alguém que tem 40 cM distribuído em 4 pedaços de mais ou menos 10 cM.
Mas, repetindo, TUDO ISSO É ESPECULATIVO. São estatísticas. Há faixas (novamente me refiro ao quadro acima) que, estatisticamente, são praticamente certas; mas há outras onde a certeza diminui bastante. Mesmo dentro das faixas expressas no quadro podem ser encontradas exceções (por exemplo, pessoas que tenham um pouco menos do que a faixa expressa, mas tem aquele nível de parentesco, ou outras que tenham um pouco mais e também tenham). A tabela foi montada através da observação dos matches conhecidos e sua comparação com os parentescos (de forma estatística).
Agora que já expliquei o que são os testes, no próximo post (devido ao tamanho deste) vou falar sobre os riscos, benefícios, e a aplicabilidade dele (ou não) à genealogia.
Comentários
Continuando o post anterior...
Fazer um teste genético do tipo "family finder" deve ser uma decisão CONSCIENTE e que CONSIDERE OS "RISCOS" perante os benefícios. Mas que riscos poderiam ser estes? De diversos tipos:
Isso tudo é absolutamente individual. Eu, por exemplo, testei a mim e à minha mãe, e agora tenho certeza de que ela é minha mãe. 😁 Meu pai já é falecido mas, através dos matches que encontrei e que pude associar DOCUMENTALMENTE (através de pesquisa genealógica) aos parentes do pai do meu pai em Portugal, também tenho certeza de que ele é meu pai. Testei ainda minha esposa, a mãe dela e dois irmãos (para fazer a genealogia dela) e, novamente, todos os resultados vieram como esperado. Mas, podia ser diferente? Sim, podia. Toda família tem segredos, acredite. Assim, é preciso estar preparado e consciente antes de fazer o teste.
Agora, vamos aos benefícios (no próximo post).
Continuando o post anterior (2):
Os benefícios do teste "family finder" podem variar enormemente. Se você já tem uma árvore genealógica bem desenvolvida em todos os seus ramos, e se você conhece pelo menos até os seus bisavós, possivelmente o teste não ajudará muito para ENCONTRAR parentes. Isso não quer dizer que ele será completamente inútil... Mesmo eu, que já tinha ramos que chegavam ao século XVI na minha árvore, consegui não só CONFIRMAR determinados parentescos mais distantes (através de matches com pessoas ainda vivas e a comparação das árvores para encontrar o ascendente comum) mas também encontrar primos distantes (quarto, quinto graus) que depois vim inclusive a conhecer pessoalmente (especialmente em Portugal). Por outro lado, se você não conseguiu avançar muito e tem poucas informações sobre seus ascendentes a partir dos avós, PODE SER (isso é, novamente, loteria, pois dependerá de encontrar parentes que também fizeram o teste) que consiga avançar na árvore devido aos matches. Minha esposa, por exemplo, cuja documentação é mais escassa por uma série de fatores, conseguiu encontrar ligações específicas só por causa dos testes dela e dos parentes dela. Mas e um trabalho investigativo, que envolve paciência, tempo e muito suor.
Vale também lembrar que, para o bem ou para o mal, as pessoas que FUTURAMENTE fizerem testes genéticos e entrarem no banco de dados serão comparadas com seu DNA. Ou seja, você pode fazer o teste, não encontrar nada relevante, e um belo dia, daqui a um ou dois anos, receber um e-mail do site dizendo que um irmão desconhecido seu apareceu (o que provavelmente será um choque) ou que foi encontrado um match de primo de segundo grau que permitirá a você avançar em suas pesquisas. Em resumo, o teste não se encerra quando seus resultados aparecem, ele continua sendo feito diariamente, com cada novo usuário do site.
Estas vantagens dependerão também da sua ascendência. Por exemplo, os testes são bastante populares em Portugal, Brasil, EUA, Reino Unido. Já na Itália, MUITO pouca gente faz o teste. Apesar de ter ascendência italiana, praticamente não encontrei matches neste ramo, ao passo que, nos ramos portugueses, tenho centenas (a grande maioria distante demais para ser considerado mas, ainda assim, são matches).
Outra coisa interessante, mas puramente informativa, é que (através de outras técnicas estatísticas), você poderá conhecer os povos antigos aos quais seus antepassados pertenciam. O site que uso mostra quatro idades diferentes (Idade do Bronze, do Ferro, Era Romana e Idade Média) e a quais povos meus antepassados provavelmente pertenciam. Isso é feito através do estudo de marcadores genéticos específicos que eu tenho hoje e que pertenciam exclusivamente àqueles povos.
Além disso, você terá uma aproximação do seu DNA com as populações ATUAIS, dizendo (de novo, de forma estatística) quantos por cento do seu DNA sugerem que você tenha ascendência de cada povo. No meu caso, isso bateu quase que perfeitamente com o que eu descobri nas pesquisas genealógicas documentais. Só não caia na esparrela de alguns que, depois de descobrirem que têm 2% de DNA escandinavo, saem por aí dizendo que são vikings. 😂
Agora, falemos da NACIONALIDADE. Para isso, a utilidade dos testes é praticamente nula. A lei portuguesa (e, até onde sei, TODAS as leis) só considera a DOCUMENTAÇÃO. Em resumo, você pode provar que 95% do seu DNA indica que você é descendente de portugueses, e isso não adiantará de nada. A única exceção (teórica, nunca ouvi falar de caso concreto) seria conseguir provar, pelo DNA, que você é filho de um português, depois fazer com que a justiça reconheça esse parentesco e, finalmente, usar isso para pedir a cidadania. Nem sei se isso é possível legalmente em Portugal, mas seria o único caso, se for possível, em que poderia ter alguma utilidade para esse fim.
Bem, escrevi quilômetros, e ACHO que consegui cobrir o BÁSICO. Deixo abaixo alguns links caso queira ler mais. OBS: nos dois casos de venda abaixo, os sites avisaram antes que seriam vendidos e deram tempo para fosse solicitada a deleção dos dados de quem assim quisesse. No caso do GedMatch eu deletei os meus, no caso do 23AndMe eu não era cliente e, no final, ele acabou sendo adquirido pelo fundador e não pelo laboratório que estava tentando comprá-lo. Mas, sobre a deleção, NUNCA saberemos de fato se os dados foram deletados, embora fosse isso o que estava escrito na política de uso quando me tornei cliente.
Obrigado por uma resposta de tão grande detalhamento, @andrelas.
Eu entendo muito pouco — quase nada — disso, mas sou médico, então pelo menos posso esclarecer o que são centiMorgans e de que forma eles são relevantes para a determinação estatística da "conexão familiar" entre dois indivíduos, para tentar lhe ajudar em algo, também.
Células germinativas (mais especificamente, espermatócitos no sexo masculino e ovócitos no sexo feminino), quando passam pelo processo de meiose (através do qual uma célula diploide, 2n, com 46 cromossomos [23 pares de cromossomos homólogos, basicamente], se transforma em uma célula haploide, n, com 23 cromossomos), também passam por um processo chamado de crossover, no qual, basicamente, cromossomos homólogos (cada um dos pares de representantes de cada cromossomo, sendo um do pai e um da mãe) trocam informações genéticas. Apenas para esclarecimento: esse processo é "evolutivamente útil" pois é um dos principais mecanismos atrelados à geração de variabilidade genética, já que se "misturando" as "informações genéticas" de ambos cromossomos de cada par de cromossomos homólogos, basicamente se cria variantes únicas a cada singular crossover tido. Acontece que, conforme pode ser visto abaixo, essas trocas são feitas em "quebras" em cada um dos cromossomos, em uma localidade aleatória, com um cromossomo "a" pegando uma parte de um cromossomo "b" e integrando a si; e o outro, cromossomo "b", pegando a outra correspondente parte do cromossomo "a" e integrando a si (basicamente trocando informações entre si).
Agora, repare que, quanto mais próximos dois loci ("posição" de uma parte qualquer de um cromossomo) um do outro num dado cromossomo, menor a probabilidade de que eles tenham "quebras" ocorridas entre si, tendo visto que eles estão espacialmente mais próximos e que, portanto, seria estatisticamente improvável uma "quebra" ocorrer exatamente naquele ponto entre eles. A recíproca é válida: quanto mais distantes dois genes um do outro, maior a probabilidade de que eles tenham "quebras" ocorridas entre si.
Disso, surgem as óbvias conclusões
Qual a associação disso com centiMorgans?
A definição de 1 centiMorgan (retirei do Wikipédia para facilitar, mas está certa, hahahaha) é: "a distância entre dois loci na qual o número médio esperado de crossovers entre si em uma geração é de 0,01". Em outras palavras, é a distância entre dois loci na qual a cada geração, a chance de um crossover ocorrer entre os loci é de 1%.
É claro que esta unidade (centiMorgan), portanto, não é um valor fixo, tendo visto que irá variar por várias razões: tamanho do genoma (que varia entre cada espécie e até entre cada sexo de cada espécie), localidade dos loci no cromossomo (com algumas regiões mais propensas, por motivos físico-químicos, a sofrerem "quebras"), etc. Contudo, na Medicina (não sei se na Genética Aplicada à Genealogia também, mas obviamente assumo que não), basicamente adotamos o valor aproximado de 1 cM = 1.000.000 bp = 1 Mbp, sendo que "bp" significa base pairs ("pares de bases").
O que são "pares de bases"?
O DNA é, de forma bem resumida, um "tipo de ácido nucleico"; sendo que, estruturalmente, é um polímero cujos monômeros são nucleotídeos. Nucleotídeos são, basicamente, bases nitrogenadas (as famosas pirimidinas citosina e timina e purinas adenina e guanina) ligadas a açúcares (desoxirribose, no caso do DNA) e a grupamentos fosfato. Por que "pares", então? Porque o DNA é composto por uma dupla fita, sendo que cada fita se interliga entre si através de ligações moleculares entre as "bases" nitrogenadas. Daí, "pares de bases".
Logo, na espécie humana, 1 centiMorgan é basicamente 1 milhão de pares de bases nitrogenadas de "distância".
Concluindo:
Assumindo o valor genérico e simplificado de que o genoma humano contém aproximadamente 3.300 centiMorgans (3.300.000.000 pares de bases), e tendo conhecimento de que somos diploides, se tem o total de 6.600 centiMorgans (6.600.000.000), no total, em um indivíduo.
Assim, ao se dizer que há "3.300 centiMorgans" de compatibilidade entre dois indivíduos, basicamente se afirma que 50% de todo o "conteúdo genético" de ambos os indivíduos é exatamente igual, com ambos partilhando entre si 3.300.000.000 pares de bases nitrogenadas.
É por isso, por exemplo, que em "Parents" consta o valor de 2376-3720 cM (número que margeia e inclui o já supracitado valor que representa aproximadamente metade de todo "conteúdo genético" de um indivíduo), levando em consideração que aproximadamente metade do "conteúdo genético" de um indivíduo advém de sua mãe, e a outra metade de seu pai ("aproximadamente" pois deve-se levar em consideração todos os mecanismos de variabilidade genética entremeados neste interim, os quais já mencionei no primeiro post). Este valor advém tanto deste conhecimento quanto da aplicação de Matemática (Estatística), a qual visa determinar até quais limites numéricos a dita associação é "forte" o suficiente para que não tenha ocorrido meramente ao acaso.
Entretanto, essa parte Matemática (Estatística) já foge à minha alçada de médico e adentra conhecimentos muito específicos que tangem mais à Genética Aplicada à Genealogia, mesmo.
@Chrieso , obrigado pela explicação também!
Que nada, @andrelas. Espero ter contribuído, pelo menos um pouco, com seu já vasto conhecimento acerca de Genealogia; e fico feliz de tê-lo feito se assim for. Dizem que "ninguém é tão burro que não possa ensinar", não é? Hahahaha
Eu fiquei curioso: existem outros tipos de testes genéticos aplicados à Genealogia que não estes "Family Finders"? Eu vejo muita gente falar a respeito de testes que informam acerca de "percentagem de herança genética africana" e "percentagem de herança genética europeia", ou algo nestes moldes. Sei que você mencionou isto nos seus posts aqui, mas me deu um ar (numa interpretação talvez incorreta) de que esta seria uma consequência meio que secundária dos "Testes Family Finders". Afinal, existe algum teste que se propunha exatamente a isto? Existe algum outro tipo de teste com algum outro propósito genealógico?
Grato desde já!
@Chrieso , com certeza contribuiu!
O teste é o mesmo, o objetivo é que varia de pessoa para pessoa. Há quem faça primordialmente para:
De qualquer forma, quando você faz o teste você recebe QUASE o "pacote completo" (exceto a parte de saúde), queira ou não. 😂 Pode fazer para encontrar parentes distantes por interesse genealógico e descobrir que não é filho daquele que acredita ser seu pai (ou mesmo adotado de pai e mãe), pode achar irmãos ou meios-irmãos que não sabia que existiam, pode (se testar também um primo) descobrir que não é primo de fato dele e que a mãe dele "pulou o muro" e ninguém sabia, etc. Por isso disse que é preciso ter consciência disso (e já saber o que fará caso algo como o acima aconteça) antes de fazer o teste. Esse tipo de segredo pode ser difícil de carregar consigo e, por outro lado, contar para alguém pode causar um caos familiar. Mas, claro, isso é BEM raro de acontecer (mas acontece).
Fora isso tudo, há ainda testes com custo adicional mas que só tem real interesse em casos específicos (dúvidas sobre ascendência ou pesquisas genéticas de populações), como os da imagem abaixo. São caros e, sinceramente, para 99% das pessoas não fazem qualquer sentido:
Os testes de saúde não são oferecidos por todas as empresas e eu, sinceramente, acho que não fazem muito sentido. Vão te fornecer um relatório gigantesco, com dezenas ou centenas de marcadores de risco aumentado para essa ou aquela condição que, no final, tem consequência muito mais de te deixar paranóico de ter uma doença que você não poderia fazer nada para evitar do que qualquer outra coisa. Uma coisa é se houvesse como EVITAR as doenças mas, na maioria delas, não há - é uma informação inócua para prevenção. Existem exames específicos, solicitados por médicos (que você, como médico, conhece muito melhor do que eu) para condições e casos também específicos, quando há uma história familiar que justifique e quando existem ações que podem ajudar a prevenir o desenvolvimento da doença. Esses sim, fazem sentido. Um relatório dizendo tudo o que você tem no seu DNA que pode te matar, não. 😁 Como exemplo, eu fiz upload do DNA da minha sogra para um site que fazia estes testes de forma gratuita e fornecia o resultado. Veio um relatório com umas 50 coisas que poderiam matá-la... Pois ela morreu com 91 anos de idade de algo completamente não relacionado e que tinha a ver com a idade e o desgaste natural do corpo, não com genética...
Em resumo, o teste "principal" é um só, mas o que leva a pessoa a fazer varia de indivíduo para indivíduo. Isso, inclusive, é algo um pouco irritante para nós, genealogistas que, vira e mexe, encontramos um match genealógico interessantíssimo mas que não tem nenhuma árvore genealógica no site para comparar e não responde as mensagens (enviadas através do site). 😂
@andrelas
Existe algum serviço específico que você recomende para realizar estes testes? Talvez alguma empresa com mais demonstrada idoneidade, ou com um database maior?
Eu adoraria saber fazer pesquisas documentais como o pessoal faz aqui no fórum (inclusive, foi aqui que encontraram, com uma facilidade inacreditável, os assentos de nascimento de ambos meus bisavós portugueses, além de passaportes e outros documentos), para poder desenvolver melhor a minha árvore genealógica. Uma pena que não seja tão acessível a metodologia pela qual fazer tais pesquisas.
@Chrieso , quanto às pesquisas documentais eu posso ajudar você a se ambientar. Acredite, 40% é conhecer os sites e ferramentas corretos, 20% é entender como os livros genealógicos funcionam em cada local (isso varia de país para país e até de época para época), 20% é método e raciocínio lógico, e 20% é experiência. Os 40% iniciais são "dados" quando indicamos os sites, os 20% do entendimento dos livros vem aos poucos (e parte pode ser dada também por quem já os conhece), os 20% do método e raciocínio são individuais, e a experiência vem com o tempo. 😁 Mas isso só vale a pena se houver interesse seu em construir sua árvore genealógica pois, assim, você terá um objetivo com o aprendizado. Aprender por aprender não será muito "recompensador" e, além disso, fará a parte da "experiência" demorar mais.
Vou te enviar uma mensagem privada.
@andrelas eu tenho muito pouco a contribuir, já que não sou especialista no assunto, mas gostaria de agradecer o colega pela excelente leitura, foi bem informativo mesmo.
@LeoSantos , obrigado! O bom de fóruns organizados como esse é que cada um de nós tem interesses, hobbys e conhecimentos que os outros não têm. Aqui você não pôde contribuir (aliás, estou longe de ser especialista, me chamaria de "entusiasta" em genealogia 😊), mas certamente há muitos outros assuntos relevantes dos quais você conhece bem mais do que eu.