skip to main content
Primo Advanced Search
Primo Advanced Search Query Term
Primo Advanced Search Query Term
Primo Advanced Search Query Term
Primo Advanced Search prefilters

Classificação taxonômica de sequências obtidas com meta-ômicas por meio de integração de dados

Lima, Felipe Prata

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Bioinformática 2019-08-20

Online access. The library also has physical copies.

  • Title:
    Classificação taxonômica de sequências obtidas com meta-ômicas por meio de integração de dados
  • Author: Lima, Felipe Prata
  • Supervisor: Setubal, João Carlos
  • Subjects: Análise Taxonômica; Bioinformática; Integração De Dados; Meta-Ômicas; Bioinformatics; Data Integration; Meta-Omics; Taxonomic Analysis
  • Notes: Tese (Doutorado)
  • Local notes: Programa Interunidades de Pós-graduação em Bioinformática
  • Description: Comunidades microbianas possuem papéis importantes em processos que ocorrem em diversos ambientes, tais como solos, oceanos e o trato gastrointestinal dos seres humanos. Portanto, é de interesse a compreensão da estrutura e do funcionamento dessas comunidades. A estrutura dessas comunidades, em termos de organismos componentes, pode ser determinada com o uso do sequenciamento de nova geração em conjunto com as técnicas meta-ômicas e pela análise taxonômica das sequências obtidas com programas de classificação taxonômica. Se por um lado diversos programas estão disponíveis, por outro lado eles cometem erros, como a identificação parcial dos organismos presentes na amostra e a identificação de organismos que não estão presentes na amostra (os falsos positivos - FPs). Algumas abordagens foram propostas para a melhoria das classificações taxonômicas obtidas por esses programas com a redução desses FPs, porém elas abordam apenas um tipo de meta-ômica, a metagenômica. Neste trabalho, propomos uma nova abordagem através da integração de diferentes meta-ômicas - metagenômicas shotgun e de amplicons de 16S, e metatranscritômica. Exploramos os resultados de classificações de dados simulados e mocks para a extração de variáveis e desenvolvemos modelos de classificação para discriminação de predições de espécies de bactérias classificadas como corretas ou incorretas. Comparamos o desempenho dos resultados obtidos entre as meta-ômicas individuais e os obtidos através da integração observando o balanceamento entre a precisão e a sensibilidade. De acordo com as medidas calculadas com nossos conjuntos de dados, nossa abordagem demonstrou melhorias na classificação com a redução de FPs e aumentos para a medida F1, quando comparada com abordagens não integrativas, inclusive com o uso de métodos de combinação de classificadores. Para facilitar seu uso, desenvolvemos o Gunga, uma ferramenta que incorpora a abordagem desenvolvida em formato de pacote do R, com funcionalidades para a integração de dados de classificação taxonômica com diferentes meta-ômicas e a classificação das predições incorretas.
  • DOI: 10.11606/T.95.2019.tde-17092019-002727
  • Publisher: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Bioinformática
  • Creation Date: 2019-08-20
  • Format: Adobe PDF
  • Language: Portuguese

Searching Remote Databases, Please Wait