Common Voice Scripted Speech 23.0 - Orizaba Nahuatl
Locale: nlv
Size: 91.99 MB
Task: ASR
Format: MP3
License: CC-0
[nauatl, mexicano] — Orizaba Nahuatl (nlv)
Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Orizaba Nahuatl (nlv). El conjunto de datos contiene 13 horas de grabaciones (12 horas validadas) de 16 hablantes.
Idioma
Lengua utilizada, según los lingüistas, en la zona del Valle de Orizaba y Sierra de Tequila - Atlahuilco.
Variantes
Se presentan datos del náhuatl de Tequila, Soledad Atzompa, Rafael Delgado e Ixhuatlancillo.
Información demográfica
El conjunto de datos incluye la siguiente distribución de edad y género.
Género
Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.
Edad
Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.
Corpus de texto
Frases simples y cortas, no mayores en su mayoría a 7 palabras.
Sistema de escritura
Escritura Práctica, siguiendo el modelo propuesto por el Instituto Lingüístico de Verano.
Tabla de símbolos
a b ch e f g i j k l m n o p r s t tl ts u x y
Muestra
A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus. Iuan akin kichiua tlen amo ijtok ikan yejtsin amo techichikoita Amo ximoistlakauikan Nimechtitlanilia ik inij ik xikmatikan ken tikatej
Fuentes
Common Voice NCX Corpus Mod Common Corpus NLV
Dominios textuales
General
Procesamiento
Recabación de texto en la "variante específica" y modificación para eliminar ambigüedades producto de la mala recabación anterior.
Autores de la ficha técnica
Luis Samuel Santiago Melchor: lssm676969@gmail.com
Financiamiento
Mozilla Common Voice
Licencia
Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.