Chamamos de “dados brutos” de DNA a informação extraída de uma amostra de DNA enviada a um laboratório de genética.
A maioria dos testes genéticos de ancestralidade produz cerca de 600 a 700 mil dados genéticos herdados dos lados paterno e materno, e esses dados são utilizados determinar a estimativa étnica de um indivíduo e calcular os resultados do teste de ancestral.
Em alguns casos, os dados brutos são fornecidos em um arquivo de texto delimitado por tabulação e outras plataformas enviam os dados brutos de DNA através de um arquivo de excel (.cvs). Este arquivo contém um cabeçalho descrevendo os dados e uma linha por cada variante analisada, com cinco colunas contendo as seguintes informações:
- O nome da variante com seu rsID
- O número do cromossomo
- A posição da variante no cromossomo
- O par de valores observados, ou seja, seus alelos (alelo 1 e alelo 2 – representando os lados paterno e materno, não necessariamente nessa ordem) neste local no genoma para essa amostra de DNA específica.
Os dados brutos incluem dois tipos de variantes genéticas no seu DNA: os SNPs (polimorfismos de nucleotídeo único) e os indels (inserção e/ou deleção de nucleotídeos).
– Para as variantes de SNP, cada alelo (materno ou paterno) é representado por uma letra, sendo A para Adenina, C para citosina, G para Guanina e T para Timina.
– Para variantes de inserção e deleção, cada alelo é representado pelas letras I ou D, em posição de Inserção ou Deleção.
Cada posição de SNP pode ter uma combinação de dois nucleotídeos dos quatro nucleotídeos (A, C, G e T). Isso significa que existem três possibilidades de genótipos para cada variante. Por exemplo: se uma variante contém A (adenina) ou C (citosina), os possíveis genótipos são AA, CC ou AC e cada um deles pode ter um impacto diferente na saúde do indivíduo.
Por convenção padrão, as localizações das variações de DNA (SNPs) são baseadas em sua posição cromossômica. Cada cromossomo é composto por 2 fitas, e a orientação da leitura do dado genético no cromossomo é comumente referido por sentido direto/positivo ou reverso. Ou seja, um genótipo AA na “cadeia positiva”, será TT na “cadeia reversa”.
As empresas seguem seus próprios protocolos, que geralmente são diferentes, mas na maioria dos casos, os dados brutos são apresentados no sentido positivo/direto do DNA.
Os relatórios gerados pela plataforma Versa Gene são apresentados no sentido positivo da fita de DNA.
Observação sobre os métodos de análise Genera:
A Genera utiliza um sistema único em que o cliente deve optar por um método de processamento no ato da compra do kit de DNA. É importante que você esteja atento a isso quando for realizar o seu teste ou quando for utilizar os seus dados brutos para gerar relatórios de saúde, pois pelo método 1, são analisados cerca de 60.000 SNPs, enquanto o método 2 analisa uma quantidade de cerca de 650.000 SNPs. Sendo assim, sempre opte pela análise no método 2 de processamento, pois o método 1 não contempla diversas variantes utilizadas nas análises da Versa Gene. Desta forma, a Versa Gene não se responsabiliza por resultados incompletos gerados por dados brutos do método 1 de processamento da Genera.