Classificação taxonômica
de
sequências obtidas com meta-ômicas por meio
de
integração
de
dados
ABCD PBi
Classificação taxonômica
de
sequências obtidas com meta-ômicas por meio
de
integração
de
dados
Autor:
Lima, Felipe Prata
Orientador:
Setubal, João Carlos
Assuntos:
Análise Taxonômica
;
Bioinformática
;
Integração
De
Dados
;
Meta-Ômicas
;
Bioinformatics
;
Data Integration
;
Meta-Omics
;
Taxonomic Analysis
Notas:
Tese (Doutorado)
Notas Locais:
Programa Interunidades
de
Pós-graduação em Bioinformática
Descrição:
Comunidades microbianas possuem papéis importantes em processos que ocorrem em diversos ambientes, tais como solos, oceanos e o trato gastrointestinal dos seres humanos. Portanto, é
de
interesse a compreensão da estrutura e do funcionamento dessas comunidades. A estrutura dessas comunidades, em termos
de
organismos componentes, pode ser determinada com o uso do sequenciamento
de
nova geração em conjunto com as técnicas meta-ômicas e pela análise taxonômica das sequências obtidas com programas
de
classificação taxonômica. Se por um lado diversos programas estão disponíveis, por outro lado eles cometem erros, como a identificação parcial dos organismos presentes na amostra e a identificação
de
organismos que não estão presentes na amostra (os falsos positivos - FPs). Algumas abordagens foram propostas para a melhoria das classificações taxonômicas obtidas por esses programas com a redução desses FPs, porém elas abordam apenas um tipo
de
meta-ômica, a metagenômica. Neste trabalho, propomos uma nova abordagem através da integração de diferentes meta-ômicas - metagenômicas shotgun e de amplicons de 16S, e metatranscritômica. Exploramos os resultados de classificações de dados simulados e mocks para a extração de variáveis e desenvolvemos modelos de classificação para discriminação de predições de espécies de bactérias classificadas como corretas ou incorretas. Comparamos o desempenho dos resultados obtidos entre as meta-ômicas individuais e os obtidos através da integração observando o balanceamento entre a precisão e a sensibilidade. De acordo com as medidas calculadas com nossos conjuntos de dados, nossa abordagem demonstrou melhorias na classificação com a redução de FPs e aumentos para a medida F1, quando comparada com abordagens não integrativas, inclusive com o uso de métodos de combinação de classificadores. Para facilitar seu uso, desenvolvemos o Gunga, uma ferramenta que incorpora a abordagem desenvolvida em formato de pacote do R, com funcionalidades para a integração de dados de classificação taxonômica com diferentes meta-ômicas e a classificação das predições incorretas.
DOI:
10.11606/T.95.2019.tde-17092019-002727
Editor:
Biblioteca Digital
de
Teses e Dissertações da USP; Universidade
de
São Paulo; Bioinformática
Data de criação/publicação:
2019-08-20
Formato:
Adobe PDF
Idioma:
Português
Disponível na Biblioteca:
IME - Inst. Matemática e Estatística (BIO-IME-T QH507.T L732c )