Idioma:

Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos.

Kinto, Eduardo Akira

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica 2011-06-17

Acesso online. A biblioteca também possui exemplares impressos.

Enviar para

Título:
Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos.
Autor: Kinto, Eduardo Akira
Orientador: Del Moral Hernandez, Emilio
Assuntos: Aprendizado Computacional; Redes Neurais; Recuperação Da Informação; Inteligência Artificial; Support Vector Machine; Machine Learning; Information Retrieval; Artificial Neural Network; Artificial Intelligence; Text Classification
Notas: Tese (Doutorado)
Notas Locais: Sistemas Eletrônicos
Descrição: A análise das informações armazenadas é fundamental para qualquer tomada de decisão, mas para isso ela deve estar organizada e permitir fácil acesso. Quando temos um volume de dados muito grande, esta tarefa torna-se muito mais complicada do ponto de vista computacional. É fundamental, então, haver mecanismos eficientes para análise das informações. As Redes Neurais Artificiais (RNA), as Máquinas de Vetores-Suporte (Support Vector Machine - SVM) e outros algoritmos são frequentemente usados para esta finalidade. Neste trabalho, iremos explorar o SMO (Sequential Minimal Optimization) e alterá-lo, com a finalidade de atingir um tempo de treinamento menor, mas, ao mesmo tempo manter a capacidade de classificação. São duas as alterações propostas, uma, no seu algoritmo de treinamento e outra, na sua arquitetura. A primeira modificação do SMO proposta neste trabalho é permitir a atualização de candidatos ao vetor suporte no mesmo ciclo de atualização de um coeficiente de Lagrange. Dos algoritmos que codificam o SVM, o SMO é um dos mais rápidos e um dos que menos consome memória. A complexidade computacional do SMO é menor com relação aos demais algoritmos porque ele não trabalha com inversão de uma matriz de kernel. Esta matriz, que é quadrada, costuma ter um tamanho proporcional ao número de amostras que compõem os chamados vetores-suporte. A segunda proposta para diminuir o tempo de treinamento do SVM consiste na subdivisão ordenada do conjunto de treinamento, utilizando-se a dimensão de maior entropia. Esta subdivisão difere das abordagens tradicionais pelo fato de as amostras não serem constantemente submetidas repetidas vezes ao treinamento do SVM. Finalmente, é aplicado o SMO proposto para classificação de documentos ou textos por meio de uma abordagem nova, a classificação de uma-classe usando classificadores binários. Como toda classificação de documentos, a análise dos atributos é uma etapa fundamental, e aqui uma nova contribuição é apresentada. Utilizamos a correlação total ponto a ponto para seleção das palavras que formam o vetor de índices de palavras.
DOI: 10.11606/T.3.2011.tde-04112011-151337
Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica
Data de criação/publicação: 2011-06-17
Formato: Adobe PDF
Idioma: Português

Links

Voltar para lista de resultados

Realização: Logos de Redes Sociais:

Otimização e análise das máquinas de vetores de suporte aplicadas à classificação de documentos.

Kinto, Eduardo Akira

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola Politécnica 2011-06-17

Buscando em bases de dados remotas. Favor aguardar.