Idioma:

Classificação automática de texto por meio de similaridade de palavras um algoritmo mais eficiente

Fabricio Shigueru Catae Ricardo Luis de Azevedo da Rocha 1960-

2012

Localização: EPBC - Esc. Politécnica-Bib Central (FD-6178 )(Acessar)

Enviar para

Título:
Classificação automática de texto por meio de similaridade de palavras um algoritmo mais eficiente
Autor: Fabricio Shigueru Catae
Ricardo Luis de Azevedo da Rocha 1960-
Assuntos: ALGORITMOS; RECONHECIMENTO DE PADRÕES
Notas: Dissertação (Mestrado)
Notas Locais: Programa Engenharia Elétrica
Descrição: A análise da semântica latente é uma técnica de processamento de linguagem natural, que busca simplificar a tarefa de encontrar palavras e sentenças por similaridade. Através da representação de texto em um espaço multidimensional, selecionam-se os valores mais significativos para sua reconstrução em uma dimensão reduzida. Essa simplificação lhe confere a capacidade de generalizar modelos, movendo as palavras e os textos para uma representação semântica. Dessa forma, essa técnica identifica um conjunto de significados ou conceitos ocultos sem a necessidade do conhecimento prévio da gramática. O objetivo desse trabalho foi determinar a dimensionalidade ideal do espaço semântico em uma tarefa de classificação de texto. A solução proposta corresponde a um algoritmo semi-supervisionado que, a partir de exemplos conhecidos, aplica o método de classificação pelo vizinho mais próximo e determina uma curva estimada da taxa de acerto. Como esse processamento é demorado, os vetores são projetados em um espaço no qual o cálculo se torna incremental. Devido à isometria dos espaços, a similaridade entre documentos se mantém equivalente. Esta proposta permite determinar a dimensão ideal do espaço semântico com pouco esforço além do tempo requerido pela análise da semântica latente tradicional. Os resultados mostraram ganhos significativos em adotar o número correto de dimensões.
Data de criação/publicação: 2012
Formato: 93 p.
Idioma: Português

Links

Voltar para lista de resultados

Realização: Logos de Redes Sociais:

Classificação automática de texto por meio de similaridade de palavras um algoritmo mais eficiente

Fabricio Shigueru Catae Ricardo Luis de Azevedo da Rocha 1960-

2012

Buscando em bases de dados remotas. Favor aguardar.