skip to main content

Descoberta de novos inibidores para doenças infecciosas: estudos integrados de modelagem molecular e aprendizado de máquina para a malária e o COVID-19

Nogueira, Victor Henrique Rabesquine

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Física de São Carlos 2024-02-01

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Descoberta de novos inibidores para doenças infecciosas: estudos integrados de modelagem molecular e aprendizado de máquina para a malária e o COVID-19
  • Autor: Nogueira, Victor Henrique Rabesquine
  • Orientador: Fassio, Alexandre Victor; Guido, Rafael Victório Carvalho
  • Assuntos: Aprendizado De Máquina; Modelos Generativos; Covid-19; Modelagem Molecular; Malária; Malaria; Machine Learning; Generative Models; Molecular Modeling
  • Notas: Tese (Doutorado)
  • Descrição: Os processos de descoberta e desenvolvimento de fármacos são extremamente complexos, podendo levar mais de 15 anos desde a identificação do alvo até a comercialização de um medicamento com mais de $1 bi investidos ao longo desses anos. Os métodos computacionais voltados para descoberta e desenvolvimento de fármacos têm auxiliado a reduzir tanto os custos quanto o tempo de tal processo, além de maximizarem a chance de sucesso. Tais métodos têm sido essenciais para a coleta, o pré-processamento, a análise e a inferência de dados e têm desempenhado um importante papel para a descoberta de novas entidades químicas (NCE, do inglês, new chemical entities) nas últimas décadas. A busca por NCEs por métodos computacionais está associada à utilização de representações moleculares que podem influenciar diretamente na qualidade dos resultados. Neste trabalho métodos computacionais foram utilizados para a avaliação de representações moleculares e para a descoberta de novos potenciais inibidores para doenças infecciosas. Portanto, esta tese foi dividida em três partes: i) avaliação da robustez de uma representação molecular utilizando autocodificadores variacionais (VAE, do inglês, variational autoencoder); ii) geração inibidores do parasito causador da malária usando VAE; e iii) busca por inibidores da Mpro de SARS-CoV-2, combinando abordagens computacionais e ensaios experimentais. I) À medida que esforços para melhorar a robustez das representações moleculares avançam, avança a importância de métodos rigorosos para testá-las e validá-las. Usando um VAE para gerar amostras anômalas de uma representação molecular em cadeia conhecido como SELFIES, sua suposição fundamental serem sempre válidas quando convertidas em outra representação em cadeia (e.g., SMILES) foi verificada como não verdadeira neste trabalho. Os resultados obtidos mostraram que regiões específicas no espaço latente do VAE, explorado de forma contínua e radial, foram particularmente eficazes na geração de SELFIES que desafiaram a suposição fundamental. A organização da validade no espaço latente ajuda a entender melhor os fatores que afetam a confiabilidade da representação molecular. Portanto, neste trabalho propomos o VAE e a abordagem de geração de anomalias associada como uma ferramenta eficaz para avaliar a robustez de representações moleculares. II) A malária é uma das doenças tropical infecciosas com a maior taxa de mortalidade no mundo. A OMS estima que 619 mil mortes tenham ocorrido em decorrência da doença em 2021, sendo cerca de 76 % desse total mortes de crianças com menos de cinco anos de idade. O tratamento recomendado para a doença é feito com terapia combinada com derivados de artemisinina. Entretanto, o surgimento de cepas resistentes do parasito aos tratamentos disponíveis torna necessário a descoberta de novos antimaláricos. Neste trabalho é apresentado um modelo generativo utilizando VAE, treinado com um conjunto de 4 milhões de moléculas, utilizando SELFIES como representação molecular, e refinado com conjuntos distintos para a geração de novos inibidores do parasita. O modelo generativo apresentou parâmetros de qualidade satisfatórios que permitiram a proposição de mais de 100 mil moléculas como candidatas a inibidores do parasita. Diante disso, aplicamos diversos filtros classificatórios para a seleção de um subconjunto de 20 moléculas para a aquisição e/ou síntese e validação experimental. III) A pandemia de COVID-19 fez com que o mundo mudasse drasticamente. O SARS-CoV-2, vírus responsável por causar a doença, já matou aproximadamente 7 milhões de pessoas ao redor do mundo, sendo mais de 705 mil no Brasil (dados de outubro/2023). Embora as vacinas e os tratamentos tenham diminuído consideravelmente o impacto da pandemia, novas variantes virais continuam a surgir e fazem com que esforços para encontrar agentes terapêuticos sejam extremamente necessários. Nesse contexto, um estudo de triagem virtual de compostos naturais brasileiros para seleção e teste experimental de candidatos a inibidores da protease principal (Mpro) do vírus. Os 10 melhores hits virtuais foram submetidos a 100 ns de simulações de dinâmica molecular para verificação da estabilidade do modo de interação e cálculo de energia livre de ligação por MM-GBSA e metadinâmica. O composto mais promissor, taxifolina (NuBBE_139), foi avaliado experimentalmente in vitro contra a Mpro e mostrou valor de IC50 de 820 μM e um perfil de inibição competitivo. Em suma, embora contenha três partes distintas, esta tese focou na aplicação de métodos computacionais em química medicinal. Cada abordagem contribuiu sinergicamente para avanços na área ao utilizar diferentes ferramentas computacionais para alvos diferentes. Os autocodificadores variacionais geraram moléculas inéditas, com propriedades semelhantes a antimaláricos conhecidos, mas diferentes o bastante para possibilitar a proposição de novas classes de compostos com esse fim. A utilização dessa arquitetura também revelou falhas nos SELFIES, testando sua validade na conversão para SMILES e revelando, pela primeira vez, a metodologia como uma maneira eficiente de geração de anomalias representacionais. Além disso, métodos tradicionais, como triagem virtual e dinâmica molecular, permitiram a identificação de um inibidor competitivo da Mpro de SARSCoV- 2, com IC50 na faixa de submilimolar.
  • DOI: 10.11606/T.76.2024.tde-23042024-120251
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Física de São Carlos
  • Data de criação/publicação: 2024-02-01
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.