skip to main content
Visitante
Meu Espaço
Minha Conta
Sair
Identificação
This feature requires javascript
Tags
Revistas Eletrônicas (eJournals)
Livros Eletrônicos (eBooks)
Bases de Dados
Bibliotecas USP
Ajuda
Ajuda
Idioma:
Inglês
Espanhol
Português
This feature required javascript
This feature requires javascript
Primo Search
Busca Geral
Busca Geral
Acervo Físico
Acervo Físico
Produção Intelectual da USP
Produção USP
Search For:
Clear Search Box
Search in:
Acervo Físico
Or hit Enter to replace search target
Or select another collection:
Search in:
Acervo Físico
Busca Avançada
Busca por Índices
This feature requires javascript
This feature requires javascript
Summarizing multiple websites for automatic PT-BR wikipedia generation
André Seidel Oliveira Anna Helena Reali
Costa
2023
Item não circula. Consulte sua biblioteca.
(Acessar)
Detalhes
Resenhas & Tags
Solicitações
Mais Opções
This feature requires javascript
Enviar para
Adicionar ao Meu Espaço
Remover do Meu Espaço
E-mail (máximo 30 registros por vez)
Imprimir
Link permanente
Referência
EasyBib
EndNote
RefWorks
del.icio.us
Exportar RIS
Exportar BibTeX
This feature requires javascript
Título:
Summarizing multiple websites for automatic PT-BR wikipedia generation
Autor:
André Seidel Oliveira
Anna Helena Reali
Costa
Assuntos:
INTELIGÊNCIA ARTIFICIAL
;
PROCESSAMENTO DE LINGUAGEM NATURAL
;
REDES NEURAIS
Notas:
Dissertação (Mestrado)
Notas Locais:
Programa Engenharia Elétrica
Descrição:
A Wikipédia é uma importante fonte gratuita de conhecimento inteligível. Apesar disso, o portal em português do Brasil ainda carece de descrições para muitos assuntos. Em um esforço para expandir a Wikipédia brasileira, apresentamos PLSum, Portuguese Long Summarizer, um arcabouço para gerar resumos abstrativos no estilo da Wikipédia a partir de vários sítios (sites) descritivos. O arcabouço possui uma etapa extrativa seguida por uma abstrativa. Na etapa extrativa, extraem-se trechos de documentos sobre o tema de interesse e, na etapa abstrativa, ´e realizado um ajuste fino, buscando reescrever os trechos em um resumo coeso, correto e significativo. Em particular, para a etapa abstrativa, ajustamos e comparamos duas variações recentes da rede neural do tipo Transformer, a PTT5 e o Longformer. Já na etapa extrativa, inovamos ao propor um método baseado em agrupamento de representações semânticas vetoriais para seleção de sentenças relevantes. Para ajustar e avaliar os modelos, criamos uma base de dados para sumarização multi-documentos com milhares de exemplos, vinculando sítios de referência às páginas do Wikipédia. Nossos resultados mostram que é possível gerar resumos abstrativos significativos a partir do conteúdo da web em português do Brasil. Além disso, mostramos que o PLSum tem sucesso na aplicação da transferência de estilo de escrita, o que não é possível com as técnicas totalmente extrativas, predominantes na literatura. Por fim, nós também concluímos que o método de agrupamento de representações semânticas vetoriais possibilitou a extração de sentenças mais diversas na etapa extrativa.
Data de criação/publicação:
2023
Formato:
72 p.
Idioma:
Inglês
Links
Este item no Dedalus
This feature requires javascript
This feature requires javascript
Voltar para lista de resultados
Anterior
Resultado
5
Avançar
This feature requires javascript
Buscando em bases de dados remotas. Favor aguardar.
Buscando por
em
scope:(USP_FISICO)
Mostrar o que foi encontrado até o momento
This feature requires javascript
This feature requires javascript