Idioma:

Classificação de Variações Linguísticas do Português do Brasil por meio da Fala

Matos, Ariadne Nascimento

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação 2024-04-09

Acesso online

Enviar para

Título:
Classificação de Variações Linguísticas do Português do Brasil por meio da Fala
Autor: Matos, Ariadne Nascimento
Orientador: Ponti, Moacir Antonelli
Assuntos: Classificação De Variações Linguísticas; Reconhecimento Automático; Variações Linguísticas; Wav2vec 2.0 Xlsr; Automatic Recognition; Linguistic Variations; Linguistic Variations Classification
Notas: Dissertação (Mestrado)
Descrição: As variações linguísticas estão presentes em diversas localidades e fazem parte do cotidiano. Por meio delas, é possível identificar a origem linguística de uma pessoa. Classificar essas variações é importante para aplicações voltadas ao processamento de fala, sobretudo para melhorar sistemas de reconhecimento automático. Neste trabalho, com o objetivo de auxiliar na classificação das variações linguísticas do Português Brasileiro, foram exploradas redes convolucionais e técnicas que incorporam o mecanismo de atenção, como o Wav2vec 2.0 XLSR e o Audio Spectrogram Transformer. Os experimentos foram conduzidos em dois cenários: um com poucos locutores e outro com muitos locutores, utilizando três conjuntos de dados distintos: Spotify Podcasts, CORAA-ASR e Braccent. Conforme relatado na literatura, os cenários closed-set, nos quais a validação é realizada no mesmo conjunto de dados de treinamento, não refletem adequadamente a realidade. Portanto, foi adotada a validação com um conjunto de dados diferente do conjunto de treinamento, conhecida como validação cruzada. Os resultados indicaram que, mesmo no cenário closed-set, os modelos enfrentaram dificuldades para classificar as variações linguísticas com mais de duas classes. Além disso, foi observado que é necessária uma maior diversidade de locutores para abranger determinado sotaque e alcançar um desempenho satisfatório dos modelos. Para a classificação binária com muitos locutores, o modelo Wav2vec 2.0 XLSR obteve sucesso tanto no cenário closed-set, com um F1-score geral de 83%, quanto no cenário de validação cruzada, com 75%. As contribuições deste trabalho incluem o desenvolvimento de um classificador de regionalismos para Pernambuco e São Paulo capital, além da criação de subconjuntos derivados do dataset do Spotify Podcasts, abrangendo nove variações linguísticas. Apesar dos avanços significativos, a classificação dos sotaques brasileiros ainda é um desafio e exige a exploração de novas abordagens para cenários multiclasse.
DOI: 10.11606/D.55.2024.tde-10062024-161431
Editor: Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação
Data de criação/publicação: 2024-04-09
Formato: Adobe PDF
Idioma: Português

Links

Voltar para lista de resultados

Anterior Resultado 2 Avançar Ir para próxima página

Realização: Logos de Redes Sociais:

Classificação de Variações Linguísticas do Português do Brasil por meio da Fala

Matos, Ariadne Nascimento

Biblioteca Digital de Teses e Dissertações da USP; Universidade de São Paulo; Instituto de Ciências Matemáticas e de Computação 2024-04-09

Buscando em bases de dados remotas. Favor aguardar.