skip to main content
Primo Advanced Search
Primo Advanced Search Query Term
Primo Advanced Search prefilters

Fatoração de matrizes no problema de coagrupamento com sobreposição de colunas

Brunialti, Lucas Fernandes

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola de Artes, Ciências e Humanidades 2016-08-31

Online access. The library also has physical copies.

  • Title:
    Fatoração de matrizes no problema de coagrupamento com sobreposição de colunas
  • Author: Brunialti, Lucas Fernandes
  • Supervisor: Peres, Sarajane Marques
  • Subjects: Análise De Agrupamento; Coagrupamento; Fatoração De Matrizes Não-Negativas; Mineração De Texto; Cluster Analysis; Coclustering; Non-Negative Matrix Factorization; Text Mining
  • Notes: Dissertação (Mestrado)
  • Description: Coagrupamento é uma estratégia para análise de dados capaz de encontrar grupos de dados, então denominados cogrupos, que são formados considerando subconjuntos diferentes das características descritivas dos dados. Contextos de aplicação caracterizados por apresentar subjetividade, como mineração de texto, são candidatos a serem submetidos à estratégia de coagrupamento; a flexibilidade em associar textos de acordo com características parciais representa um tratamento adequado a tal subjetividade. Um método para implementação de coagrupamento capaz de lidar com esse tipo de dados é a fatoração de matrizes. Nesta dissertação de mestrado são propostas duas estratégias para coagrupamento baseadas em fatoração de matrizes não-negativas, capazes de encontrar cogrupos organizados com sobreposição de colunas em uma matriz de valores reais positivos. As estratégias são apresentadas em termos de suas definições formais e seus algoritmos para implementação. Resultados experimentais quantitativos e qualitativos são fornecidos a partir de problemas baseados em conjuntos de dados sintéticos e em conjuntos de dados reais, sendo esses últimos contextualizados na área de mineração de texto. Os resultados são analisados em termos de quantização do espaço e capacidade de reconstrução, capacidade de agrupamento utilizando as métricas índice de Rand e informação mútua normalizada e geração de informação (interpretabilidade dos modelos). Os resultados confirmam a hipótese de que as estratégias propostas são capazes de descobrir cogrupos com sobreposição de forma natural, e que tal organização de cogrupos fornece informação detalhada, e portanto de valor diferenciado, para as áreas de análise de agrupamento e mineração de texto
  • DOI: 10.11606/D.100.2016.tde-31102016-123504
  • Publisher: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Escola de Artes, Ciências e Humanidades
  • Creation Date: 2016-08-31
  • Format: Adobe PDF
  • Language: Portuguese

Searching Remote Databases, Please Wait