skip to main content
Primo Advanced Search
Primo Advanced Search Query Term
Primo Advanced Search prefilters

Novas abordagens em aprendizado de máquina para a geração de regras, classes desbalanceadas e ordenação de casos

Ronaldo Cristiano Prati Maria Carolina Monard

2006

Localização: ICMC - Inst. Ciên. Mat. Computação    (T P912na e.1 )(Acessar)

  • Título:
    Novas abordagens em aprendizado de máquina para a geração de regras, classes desbalanceadas e ordenação de casos
  • Autor: Ronaldo Cristiano Prati
  • Maria Carolina Monard
  • Assuntos: APRENDIZADO COMPUTACIONAL; MINERAÇÃO DE DADOS; INTELIGÊNCIA ARTIFICIAL
  • Notas: Tese (Doutorado)
  • Descrição: Algoritmos de aprendizado de máquina são frequentemente os mais indicados em uma grande variedade de aplicações de mineração de dados. Entretanto, a maioria das pesquisas em aprendizado de máquina refere-se ao problema bem definido de encontrar um modelo (geralmente de classificação) de um conjunto de dados pequeno, relativamente bem preparado para o aprendizado, no formato atributo-valor, no qual os atributos foram previamente selecionados para facilitar o aprendizado. Além disso, o objetivo a ser alcançado é simples e bem definido (modelos de classificação precisos, no caso de problemas de classificação). Mineraçãode dados propicia novas direções para pesquisas em aprendizado de máquina e impõe novas necessidades para outras. Com a mineração de dados, algoritmos de aprendizado estão quebrando as restrições descritas anteriormente. Dessa maneira, a grande contribuição da área de aprendizado de máquina para a mineração de dados é retribuida pelo efeito inovador que a mineração de dados provoca em aprendizado de máquina. Nesta tese, exploramos alguns desses problemas que surgiram (ou reaparecem) com o uso de algoritmos de aprendizado de máquina para mineração de dados. Mais especificamente, nos concentramos seguintes problemas: - Novas abordagens para a geração de regras. Dentro dessa categoria, propomos dois novos métodos para o aprendizado de regras. No primeiro, propomos um novo método para gerar regras de exceção a partir de regras gerais. No segundo,
    propomos um algoritmo para a seleção de regras denominado ROCCER. Esse algoritmos é baseado na análise ROC. Regras provêm de um grande conjunto externo de regras e o algoritmo proposto seleciona regras baseado na região convexa do gráfico ROC. - Proporção de exemplos entre as classes. Investigamos vários aspectos relacionados a esse tópico. Primeiramente, realizamos uma série de experimentos em conjuntos de dados artificiais com o objetivo de ) testar nossa hipótese de que o grau de sobreposição entre as classes é um fator complicante em conjuntos de dados muito desbalanceados. Também executamos uma extensa análise experimental com vários métodos (alguns deles propostos neste trabalho) para balancear artificialmente conjuntos de dados desbalaneados. Finalmente, investigamos o relacionamento entre classes desbalanceadas e pequenos disjuntos, e a influência da proporção de classes no processo de rotulação de exemplos no algoritmo de aprendizado de máquina semi-supervisionado Co-trainig. - Novo método para a combinação de rankings. Propomos um novo método, chamado BORDARANK, para construir ensembles de rankings baseado no método de votação borda count. BORDARANK pode ser alicado em qualquer problema de ordenação binária no qual vários rankings estejam disponíveis. Resultados experimentais mostram uma melhora o desempenho com relação aos rankings individuais, além de um desempenho comparável com algoritmos mais sofisticados que utilizam a predição numérica, e não
    rankings, para a criação de emsembles para o problema de ordenação binária
  • Data de criação/publicação: 2006
  • Formato: 167 p.
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.