skip to main content
Primo Advanced Search
Primo Advanced Search Query Term
Primo Advanced Search prefilters

Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias

Silva, Diego Mattozo Bernardes Da

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Estatística Interinstitucional do ICMC e UFSCarr 2017-06-13

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Métodos de categorização de variáveis preditoras em modelos de regressão para variáveis binárias
  • Autor: Silva, Diego Mattozo Bernardes Da
  • Orientador: Pereira, Gustavo Henrique de Araujo
  • Assuntos: Categorização De Variáveis Preditoras; Regressão; Risco De Crédito; Categorization Of Predictor Variables; Credit Scoring; Regression
  • Notas: Dissertação (Mestrado)
  • Descrição: Modelos de regressão para variáveis resposta binárias são muito comuns em diversas áreas do conhecimento. O modelo mais utilizado nessas situações é o modelo de regressão logística, que assume que o logito da probabilidade de ocorrência de um dos valores da variável resposta é uma função linear das variáveis preditoras. Quando essa suposição não é razoável, algumas possíveis alternativas são: realizar transformação das variáveis preditoras e/ou inserir termos quadráticos ou cúbicos no modelo. O problema dessa abordagem é que ela dificulta bastante a interpretação dos parâmetros do modelo e, em algumas áreas, é fundamental que eles sejam interpretáveis. Assim, uma abordagem muitas vezes utilizada é a categorização das variáveis preditoras quantitativas do modelo. Sendo assim, este trabalho tem como objetivo propor duas novas classes de métodos de categorização de variáveis contínuas em modelos de regressão para variáveis resposta binárias. A primeira classe de métodos é univariada e busca maximizar a associação entre a variável resposta e a covariável categorizada utilizando medidas de associação para variáveis qualitativas. Já a classe de métodos multivariada tenta incorporar a estrutura de dependência entre as covariáveis do modelo através da categorização conjunta de todas as variáveis preditoras. Para avaliar o desempenho, aplicamos as classes de métodos propostas e quatro métodos de categorização existentes em 3 bases de dados relacionadas à área de risco de crédito e a dois cenários de dados simulados. Os resultados nas bases reais sugerem que a classe univariada proposta têm um desempenho superior aos métodos existentes quando comparamos o poder preditivo do modelo de regressão logística. Já os resultados nas bases de dados simuladas sugerem que ambas as classes propostas possuem um desempenho superior aos métodos existentes. Em relação ao desempenho computacional, o método multivariado mostrou-se inferior e o univariado é superior aos métodos existentes.
  • DOI: 10.11606/D.104.2017.tde-27092017-092122
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Estatística Interinstitucional do ICMC e UFSCarr
  • Data de criação/publicação: 2017-06-13
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.