skip to main content

Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem

Silva, Augusto Cesar Monteiro

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística 2020-12-09

Acesso online. A biblioteca também possui exemplares impressos.

  • Título:
    Análise comparativa de abordagens para aprendizado de transformações imagem-a-imagem
  • Autor: Silva, Augusto Cesar Monteiro
  • Orientador: Hirata, Nina Sumiko Tomita
  • Assuntos: Aprendizado De Máquina; Segmentação De Imagens; Redes Neurais Convolucionais; Predição De Estrutura; Transformação Imagem-A-Imagem; Binarização De Imagens; Image-To-Image Transformations; Image Segmentation; Image Binarization; Convolutional Neural Networks; Structure Prediction; Machine Learning
  • Notas: Dissertação (Mestrado)
  • Descrição: Criar manualmente um operador de imagem para performar uma transformação imagem-a-imagem específica é uma tarefa árdua e dificil. O problema do aprendizado automático de operadores de imagens tem sido estudado através dos anos. Métodos que atacam ese problema podem ser divididos em três tipos: as abordagens tradicionais pixel-a-pixel ou janelas deslizantes, abordagens patch-a-patch que foram possibilitadas por modelos de aprendizado profundo, e abordagens orientadas a estrutura que são baseadas em técnicas gerativas. Cada abordagem possui suas vantagens e desvantagens próprias. O objetivo dessa dissertação é estudar as similaridades e diferenças dessas abordagens, tanto conceptualmente quanto experimentalmente. Particularmente, estamos interessados em entender o quanto de informação estrutural da imagem, como conectividade de linhas, é preservado. A primeira contribuição desse trabalho é um método que une as vantagens das abordagens pixel-a-pixel e patch-a-patch, que chamamos de SConvNet. A segunda contribuição é um estudo que mostra que a métrica baseada em similaridades de esqueletos é válida para avaliar binarização de documentos manuscritos de forma complementar a métricas pixel-a-pixel tradicionais. Por fim, apresentamos uma comparação experimental entre métodos representativos de cada uma das três abordagens, calculando métricas pixel-a-pixel e as métricas de similaridade de esqueletos em dois problemas de processamento de imagens (segmentação de vasos sanguineos de retina e binarização de documentos manuscritos). As melhores métricas pixel-a-pixel foram obtidas por métodos patch-a-patch, enquanto os métodos estruturais obtiveram vantagens nas métricas de similaridade de esqueletos, de forma consistente com uma inspeção visual, que mostra que as abordagens estruturais melhor preservam a estrutura geral enquanto os métodos patch-a-patch geram contornos mais precisos.
  • DOI: 10.11606/D.45.2020.tde-19022021-142206
  • Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Matemática e Estatística
  • Data de criação/publicação: 2020-12-09
  • Formato: Adobe PDF
  • Idioma: Português

Buscando em bases de dados remotas. Favor aguardar.