skip to main content
Tipo de recurso Mostra resultados com: Mostra resultados com: Índice

Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos

Bruscato, Lucas Peinado

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2020-02-18

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Predição de polaridade negativa em relatórios de auditoria utilizando dados socioeconômicos
  • Autor: Bruscato, Lucas Peinado
  • Orientador: Leonardi, Florencia Graciela
  • Assuntos: Dados Socioeconômicos; Web Scraper; Regressão Linear; Random Forest; Processamento De Linguagem Natural; Xgboost; Natural Language Processing; Socioeconomic Data; Linear Regression
  • Notas: Dissertação (Mestrado)
  • Descrição: A corrupção no Brasil afeta diretamente o bem-estar dos cidadãos ao diminuir os investimentos públicos na saúde, na educação, em infraestrutura, segurança, habitação, entre outros direitos essenciais à vida. A democratização da internet e a evolução da ciência de dados nos permitiu avaliar a relação de irregularidades administrativas, no caso deste trabalho palavras negativas, e mudanças em indicadores sociais sobre municípios. Desenvolvemos um algoritmo (web scraper) que automatiza a captura dos relatórios da auditoria da CGU e analisamos a polaridade das palavras presentes nos relatórios separadamente. Obtivemos os dados socioeconômicos no censo do IBGE em dois períodos e criamos modelos de aprendizado de máquina para predição do percentual de polaridade negativa por município baseado nos dados do IBGE. Para se avaliar a qualidade de um modelo complexo é importante ter um modelo simples como parâmetro de desempenho base, realizamos o treinamento de três modelos (regressão linear, random forest e xgboost) sobre a base de dados criada. As principais contribuições deste trabalho foram a extração automatizada dos dados governamentais, encontrar evidência estatística da relação entre os dados dos relatórios e dos dados socioeconômicos de fontes distintas e modelos de aprendizado de máquina funcionais para o problema proposto.
  • DOI: 10.11606/D.45.2020.tde-12032020-055952
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística
  • Data de criação/publicação: 2020-02-18
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.