skip to main content
Visitante
Meu Espaço
Minha Conta
Sair
Identificação
This feature requires javascript
Tags
Revistas Eletrônicas (eJournals)
Livros Eletrônicos (eBooks)
Bases de Dados
Bibliotecas USP
Ajuda
Ajuda
Idioma:
Inglês
Espanhol
Português
This feature required javascript
This feature requires javascript
Primo Search
Busca Geral
Busca Geral
Acervo Físico
Acervo Físico
Produção Intelectual da USP
Produção USP
Search For:
Clear Search Box
Search in:
Acervo Físico
Or hit Enter to replace search target
Or select another collection:
Search in:
Acervo Físico
Busca Avançada
Busca por Índices
This feature requires javascript
This feature requires javascript
Classificação automática de texto por meio de similaridade de palavras um algoritmo mais eficiente
Fabricio Shigueru Catae Ricardo Luis de Azevedo da Rocha 1960-
2012
Localização:
EPBC - Esc. Politécnica-Bib Central
(FD-6178 )
(Acessar)
This feature requires javascript
Localização & Reservas
Detalhes
Resenhas & Tags
Solicitações
Mais Opções
Prateleira Virtual
This feature requires javascript
Enviar para
Adicionar ao Meu Espaço
Remover do Meu Espaço
E-mail (máximo 30 registros por vez)
Imprimir
Link permanente
Referência
EasyBib
EndNote
RefWorks
del.icio.us
Exportar RIS
Exportar BibTeX
This feature requires javascript
Título:
Classificação automática de texto por meio de similaridade de palavras um algoritmo mais eficiente
Autor:
Fabricio Shigueru Catae
Ricardo Luis de Azevedo da Rocha 1960-
Assuntos:
ALGORITMOS
;
RECONHECIMENTO DE PADRÕES
Notas:
Dissertação (Mestrado)
Notas Locais:
Programa Engenharia Elétrica
Descrição:
A análise da semântica latente é uma técnica de processamento de linguagem natural, que busca simplificar a tarefa de encontrar palavras e sentenças por similaridade. Através da representação de texto em um espaço multidimensional, selecionam-se os valores mais significativos para sua reconstrução em uma dimensão reduzida. Essa simplificação lhe confere a capacidade de generalizar modelos, movendo as palavras e os textos para uma representação semântica. Dessa forma, essa técnica identifica um conjunto de significados ou conceitos ocultos sem a necessidade do conhecimento prévio da gramática. O objetivo desse trabalho foi determinar a dimensionalidade ideal do espaço semântico em uma tarefa de classificação de texto. A solução proposta corresponde a um algoritmo semi-supervisionado que, a partir de exemplos conhecidos, aplica o método de classificação pelo vizinho mais próximo e determina uma curva estimada da taxa de acerto. Como esse processamento é demorado, os vetores são projetados em um espaço no qual o cálculo se torna incremental. Devido à isometria dos espaços, a similaridade entre documentos se mantém equivalente. Esta proposta permite determinar a dimensão ideal do espaço semântico com pouco esforço além do tempo requerido pela análise da semântica latente tradicional. Os resultados mostraram ganhos significativos em adotar o número correto de dimensões.
Data de criação/publicação:
2012
Formato:
93 p.
Idioma:
Português
Links
Este item no Dedalus
E-mail do autor
E-mail do orientador
This feature requires javascript
This feature requires javascript
Voltar para lista de resultados
This feature requires javascript
This feature requires javascript
Buscando em bases de dados remotas. Favor aguardar.
Buscando por
em
scope:(USP_FISICO)
Mostrar o que foi encontrado até o momento
This feature requires javascript
This feature requires javascript