Common Voice Scripted Speech 23.0 - Central Tarahumara
Locale: tar
Size: 77.88 MB
Task: ASR
Format: MP3
License: CC-0
[Rarámuri] — Central Tarahumara (tar)
Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Central Tarahumara (tar). El conjunto de datos contiene 11 horas de grabaciones (10 horas validadas) de 17 hablantes.
Idioma
La lengua Tarahumara Central es de la familia Yuto-nahua o Yuto-azteca, de la rama de las Yuto-nahua del sur, y de la subrama Taracahíta como el Guarijío. Es hablada en Chihuahua México en los municipios de Balleza, Batopilas, El Tule, Guachochi y Morelos, nuestro estudio fue mayormente con hablantes de Norogachi, Guachochi y solamente una persona de Cusárare Guachochi, Chihuahua. INALI. 2008. Catálogo de las Lenguas Indígenas Nacionales. Variantes Lingüísticas de México con sus autodenominaciones y referencias geoestadísticas. México: SEP. INPI. 2022. Plan de Justicia del Pueblo Guarijío-Makurawe. México: Gobierno de Mëxico
Variantes
Ninguna.
Información demográfica
El conjunto de datos incluye la siguiente distribución de edad y género.
Género
Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.
Edad
Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.
Corpus de texto
Los textos son del diccionario de Brambila (1976) y unos pocos de la gramática de Brambila (1953) revisados y modificados (normalizados) por hablantes de Norogachi para la variación histórica. Longitud media de palabras es 5, y la media de caracteres es 24.
Sistema de escritura
El sistema de escritura que se basó en la escritura del Raramuri es el español, solamente que no usa las grafías H, X, C, V, Z, D, F solamente las expresadas abajo y también incluye la glotal '
Tabla de símbolos
A B K CH E G ' I J L M N O P R S T U W Y
Muestra
A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus.
kéni raíchiki; pé meká jónsa rewáki 2. ¿ámi tami ákima ramé bewaála? 3. ¿mi páli anéli? 4. ku bitíchi simí neba 5. pe Róbrika raléki sunú neko
Fuentes
Brambila, D. 1976. Diccionario Rarámuri-Castellano. Mexico, D.F.: La Buena Prensa Brambila, D. 1953. Gramática Rarámuri. Mexico, D.F.: La Buena Prensa.
Dominios textuales
General
Procesamiento
El texto era antiguo entonces se verificó con hablantes de Norogachi que revisaran si había léxico diferente, etc.
Postprocesamiento recomendado
Si se trabaja con personas de otras comunidades tienen que normalizar los datos, es decir adaptarlos a las variaciones dialectales de la otra comunidad. Hubo una hablante de Cusarare, Guachochi que está considerado de la misma lengua y tenía dudas sobre algunas palabras.
Autores de la ficha técnica
Maria Alfonsa Larios Santacruz.mariaalfonsa@hotmail.com
Financiamiento
Mozilla Foundation: Common Voice México.
Licencia
Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.