Aplicación de una Red Neuronal Convolucional para el Reconocimiento de Personas a través de la Voz
Fecha
2018-12-04Palabras Clave
Espectrograma, Red Neuronal Convolucional, Reconocimiento de Personas, Red Neuronal ProfundaMetadatos
Mostrar el registro completo del ítemResumen
El reconocimiento de personas a traves de la voz
se ha popularizado recientemente en aplicaciones para telefonos
moviles, seguridad, robótica social, entre otras. Los métodos
convencionales de reconocimiento a partir de la voz utilizan
coeficientes para generar vectores de características presentes
en el audio que alimentan modelos de aprendizaje automático.
Aunque se obtienen excelentes resultados con estos metodos
convencionales, se requiere una alta cantidad de muestras de
voz por persona para entrenar los modelos de aprendizaje
automático, lo cual es una tarea tediosa para los usuarios. En
ese sentido, el objetivo de este trabajo consiste en utilizar un
método no convencional en aras de disminuir la cantidad de
muestras requeridas para el entrenamiento. El método propuesto
consiste en generar imágenes con los espectrogramas de la voz,
para entrenar una red neuronal convolucional que las clasifique.
En este trabajo se comparan los resultados de entrenamiento y
validación para distintas cantidades de muestras con el propósito
de identificar la cantidad adecuada. Luego, con la cantidad
identificada se comparan los resultados de entrenamiento y
validación para distintos valores de un parámetro utilizado en
la generación de los espectrogramas denominado ganancia, con
el objetivo de optimizar los resultados. Los mejores resultados
obtenidos indican que deben utilizarse 5 muestras con una
ganancia de 0.9, para obtener una exactitud de validacion del
93,34%.
Colecciones
Información Adicional
Correo Electrónico | [email protected] [email protected] [email protected] |
Editor | Sexta Conferencia Nacional de Computación, Informática y Sistemas / CoNCISa 2018 |
ISBN | 978-980-7683-04-3 |
Colación | 77-81 |
Institución | Universidad de Los Andes |