Common Voice Scripted Speech 23.0 - Orizaba Nahuatl

Locale: nlv

Size: 91.99 MB

Task: ASR

Format: MP3

License: CC-0


[nauatl, mexicano] — Orizaba Nahuatl (nlv)

Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Orizaba Nahuatl (nlv). El conjunto de datos contiene 13 horas de grabaciones (12 horas validadas) de 16 hablantes.

Idioma

Lengua utilizada, según los lingüistas, en la zona del Valle de Orizaba y Sierra de Tequila - Atlahuilco.

Variantes

Se presentan datos del náhuatl de Tequila, Soledad Atzompa, Rafael Delgado e Ixhuatlancillo.

Información demográfica

El conjunto de datos incluye la siguiente distribución de edad y género.

Género

Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.

Edad

Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.

Corpus de texto

Frases simples y cortas, no mayores en su mayoría a 7 palabras.

Sistema de escritura

Escritura Práctica, siguiendo el modelo propuesto por el Instituto Lingüístico de Verano.

Tabla de símbolos

a b ch e f g i j k l m n o p r s t tl ts u x y

Muestra

A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus. Iuan akin kichiua tlen amo ijtok ikan yejtsin amo techichikoita Amo ximoistlakauikan Nimechtitlanilia ik inij ik xikmatikan ken tikatej

Fuentes

Common Voice NCX Corpus Mod Common Corpus NLV

Dominios textuales

General

Procesamiento

Recabación de texto en la "variante específica" y modificación para eliminar ambigüedades producto de la mala recabación anterior.

Autores de la ficha técnica

Luis Samuel Santiago Melchor: lssm676969@gmail.com

Financiamiento

Mozilla Common Voice

Licencia

Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.