skip to main content

The Similarity-aware Relational Division Database Operator

André dos Santos Gonzaga Robson Leonardo Ferreira Cordeiro

2017

Localização: ICMC - Inst. Ciên. Mat. Computação    (T G642sa e.1 )(Acessar)

  • Título:
    The Similarity-aware Relational Division Database Operator
  • Autor: André dos Santos Gonzaga
  • Robson Leonardo Ferreira Cordeiro
  • Assuntos: MINERAÇÃO DE DADOS; FRACTAIS -- TEORIA; BANCO DE DADOS; ANÁLISE DE DADOS; Bases De Dados; Comparação Por Similaridade; Comparison By Similarity; Complex Data; Dados Complexos; Databases; Divisão Em Álgebra Relacional; Division In The Relational Algebra; Agrupamento De Dados
  • Notas: Dissertação (Mestrado)
  • Descrição: O operador de Divisão (÷) da Álgebra Relacional permite representar de forma simples consultas com o conceito de para todos, e por isso é requerido em diversas aplicações reais. Entretanto, evidencia-se neste trabalho de mestrado que a divisão não atende às necessidades de diversas aplicações atuais, principalmente quando estas analisam dados complexos, como imagens, áudio, textos longos, impressões digitais, entre outros. Analisando o problema verifica-se que a principal limitação é a existência de comparações de valores de atributos intrínsecas à Divisão Relacional, que, por definição, são efetuadas sempre por identidade (=), enquanto objetos complexos devem geralmente ser comparados por similaridade. Hoje, encontram-se na literatura propostas de operadores relacionais com suporte à similaridade de objetos complexos, entretanto, nenhuma trata a Divisão Relacional. Este trabalho de mestrado propõe investigar e estender o operador de Divisão da Álgebra Relacional para melhor adequá-lo às demandas de aplicações atuais, por meio de suporte a comparações de valores de atributos por similaridade. Mostra-se aqui que a Divisão por Similaridade é naturalmente adequada a responder consultas diversas com um conceito de elementos candidatos e exigências descrito na monografia, envolvendo dados complexos de aplicações reais de alto impacto, com potencial por exemplo, para apoiar a agricultura, análises de dados genéticos, buscas em bibliotecas digitais, e até mesmo para controlar a
    qualidade de produtos manufaturados e a identificação de novos clientes em indústrias. Para validar a proposta, propõe-se estudar as duas primeiras aplicações citadas.
  • Data de criação/publicação: 2017
  • Formato: 70 p.
  • Idioma: Inglês

Buscando em bases de dados remotas. Favor aguardar.