Please use this identifier to cite or link to this item:
http://repositorio.utm.mx:8080/jspui/handle/123456789/464
Title: | Reconocimiento híbrido de emociones a partir del análisis de voz y de expresiones faciales |
Authors: | RAÚL CRUZ BARBOSA;342911 ARTURO TÉLLEZ VELÁZQUEZ;177179 Cruz Barbosa, Raúl Carrasco Jiménez, Jorge A. |
Keywords: | Reconocimiento de emociones; aprendizaje profundo; CNN |
Issue Date: | May-2023 |
Publisher: | Universidad Tecnológica de la Mixteca |
Citation: | Carrasco, J. A. (2023). Reconocimiento híbrido de emociones a partir del análisis de voz y de expresiones faciales (Tesis para obtener el título de Maestro en Tecnologías de Cómputo Aplicado). Universidad Tecnológica de la Mixteca, Huajuapan de León, Oaxaca. |
Abstract: | Con el fin de encontrar modelos precisos de alta exactitud de clasificación para el reconocimiento de emociones mediante la voz, se utilizan diferentes técnicas con redes neuronales convolucionales 1D y 2D. En la red 2D utilizada (FSER) se propone una transformación de información de audio a imagen a través de una representación espectral. Experimentalmente se determina que, para UTeMo, se extraen las características más representativas de cada emoción a partir de los cocleogramas, ya que con esta representación se alcanza un 95.08 % de exactitud de clasificación. En el caso del reconocimiento de emociones mediante expresiones faciales se toma en consideración el análisis temporal entre imágenes mediante técnicas de flujo óptico. Sin embargo, experimentalmente se determina que hay un mejor desempeño realzando las características de las imágenes de los rostros y utilizando éstas como fuente de información. Utilizando las imágenes de las expresiones faciales con realce de características y la arquitectura MobileNet se logra un 95.96 % de exactitud de clasificación. |
URI: | http://repositorio.utm.mx:8080/jspui/handle/123456789/464 |
Appears in Collections: | Maestría |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2023-MTCA-JACJ.pdf | 6.13 MB | Adobe PDF | View/Open |
This item is licensed under a Creative Commons License