Influência do número de repetições na identificação de genes diferencialmente expressos em experimentos de RNA-Seq
Conteúdo do artigo principal
Resumo
O objetivo deste trabalho foi avaliar duas importantes metodologias estatísticas destinadas a avaliar perfis de expressão gênica em condições biológicas distintas (DESeq e baySeq) com a finalidade de verificar a influência do número de repetições na identificação de genes diferencialmente expressos (GDE); assim como avaliou a sobreposição dos GDE encontrados nos diferentes contrastes estabelecidos, dentro e entre os métodos estudados. Por fim foi avaliada a taxa de falsos positivos encontrados por estas duas metodologias. Para esta avaliação, foram criados quatro cenários mimetizando experimentos reais, representando duas condições experimentais, sendo cada cenário composto por números diferentes de repetições. O pacote TCC implementado no Bioconductor foi utilizado para geração dos dados analisados, tendo cada observação 1000 genes simulados, onde 200 são diferencialmente expressos (DE) e 800 não DEs. Em um primeiro momento, os dados foram analisados separadamente por cada método, comparando-se apenas a influência do número de repetições na identificação dos GDE. Em seguida, foi realizada a comparação entre os resultados obtidos por cada método, levando em conta também o número de repetições em cada cenário. Conforme observado para os dois métodos analisados, a redução do número de repetições diminui o poder destas metodologias em detectar GDE. Constatou-se ao comparar dois cenários por vez, para cada metodologia, que um maior percentual de GDE comuns foi encontrado ao considerar maior número de repetição. A maioria dos GDE foi identificada, simultaneamente, pelas duas metodologias, em função do número de repetições. O método emprementado no pacote baySeq apresentou melhor acurácia nos cenários onde havia 5 repetições e no cenário sem repetições. Assim, pode-se dizer que o baySeq apresentou maior sensibilidade, ou seja, maior taxa de verdadeiros positivos e menor taxa de falsos positivos em relação ao DESeq sob estas condições.
Detalhes do artigo
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).