Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq

Conteúdo do artigo principal

Regiane AMARAL
Moyses NASCIMENTO
Talles Eduardo Ferreira MACIEL
Fabyano Fonseca e SILVA
Ana Carolina Campana NASCIMENTO
Luiz Alexandre PETERNELLI
Simone Eliza Facioni GUIMARÃES

Resumo

O objetivo deste trabalho foi avaliar duas importantes metodologias estatísticas destinadas a avaliar perfis de expressão gênica em condições biológicas distintas (DESeq e baySeq) com a finalidade de verificar a influência do número de repetições na identificação de genes diferencialmente expressos (GDE); assim como avaliou a sobreposição dos GDE encontrados nos diferentes contrastes estabelecidos, dentro e entre os métodos estudados. Por fim foi avaliada a taxa de falsos positivos encontrados por estas duas metodologias. Para esta avaliação, foram criados quatro cenários mimetizando experimentos reais, representando duas condições experimentais, sendo cada cenário composto por números diferentes de repetições. O pacote TCC implementado no Bioconductor foi utilizado para geração dos dados analisados, tendo cada observação 1000 genes simulados, onde 200 são diferencialmente expressos (DE) e 800 não DEs. Em um primeiro momento, os dados foram analisados separadamente por cada método, comparando-se apenas a influência do número de repetições na identificação dos GDE. Em seguida, foi realizada a comparação entre os resultados obtidos por cada método, levando em conta também o número de repetições em cada cenário. Conforme observado para os dois métodos analisados, a redução do número de repetições diminui o poder destas metodologias em detectar GDE. Constatou-se ao comparar dois cenários por vez, para cada metodologia, que um maior percentual de GDE comuns foi encontrado ao considerar maior número de repetição. A maioria dos GDE foi identificada, simultaneamente, pelas duas metodologias, em função do número de repetições. O método emprementado no pacote baySeq apresentou melhor acurácia nos cenários onde havia 5 repetições e no cenário sem repetições. Assim, pode-se dizer que o baySeq apresentou maior sensibilidade, ou seja, maior taxa de verdadeiros positivos e menor taxa de falsos positivos em relação ao DESeq sob estas condições.

Detalhes do artigo

Como Citar
AMARAL, R., NASCIMENTO, M., MACIEL, T. E. F., SILVA, F. F. e, NASCIMENTO, A. C. C., PETERNELLI, L. A., & GUIMARÃES, S. E. F. (2018). Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq. REVISTA BRASILEIRA DE BIOMETRIA, 36(1), 36–47. https://doi.org/10.28951/rbb.v36i1.112
Seção
Articles

Artigos mais lidos pelo mesmo(s) autor(es)

1 2 > >>