Common Voice Scripted Speech 23.0 - Central Tarahumara

Locale: tar

Size: 77.88 MB

Task: ASR

Format: MP3

License: CC-0


[Rarámuri] — Central Tarahumara (tar)

Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Central Tarahumara (tar). El conjunto de datos contiene 11 horas de grabaciones (10 horas validadas) de 17 hablantes.

Idioma

La lengua Tarahumara Central es de la familia Yuto-nahua o Yuto-azteca, de la rama de las Yuto-nahua del sur, y de la subrama Taracahíta como el Guarijío. Es hablada en Chihuahua México en los municipios de Balleza, Batopilas, El Tule, Guachochi y Morelos, nuestro estudio fue mayormente con hablantes de Norogachi, Guachochi y solamente una persona de Cusárare Guachochi, Chihuahua. INALI. 2008. Catálogo de las Lenguas Indígenas Nacionales. Variantes Lingüísticas de México con sus autodenominaciones y referencias geoestadísticas. México: SEP. INPI. 2022. Plan de Justicia del Pueblo Guarijío-Makurawe. México: Gobierno de Mëxico

Variantes

Ninguna.

Información demográfica

El conjunto de datos incluye la siguiente distribución de edad y género.

Género

Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.

Edad

Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.

Corpus de texto

Los textos son del diccionario de Brambila (1976) y unos pocos de la gramática de Brambila (1953) revisados y modificados (normalizados) por hablantes de Norogachi para la variación histórica. Longitud media de palabras es 5, y la media de caracteres es 24.

Sistema de escritura

El sistema de escritura que se basó en la escritura del Raramuri es el español, solamente que no usa las grafías H, X, C, V, Z, D, F solamente las expresadas abajo y también incluye la glotal '

Tabla de símbolos

A B K CH E G ' I J L M N O P R S T U W Y

Muestra

A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus.

  1. kéni raíchiki; pé meká jónsa rewáki 2. ¿ámi tami ákima ramé bewaála? 3. ¿mi páli anéli? 4. ku bitíchi simí neba 5. pe Róbrika raléki sunú neko

Fuentes

Brambila, D. 1976. Diccionario Rarámuri-Castellano. Mexico, D.F.: La Buena Prensa Brambila, D. 1953. Gramática Rarámuri. Mexico, D.F.: La Buena Prensa.

Dominios textuales

General

Procesamiento

El texto era antiguo entonces se verificó con hablantes de Norogachi que revisaran si había léxico diferente, etc.

Postprocesamiento recomendado

Si se trabaja con personas de otras comunidades tienen que normalizar los datos, es decir adaptarlos a las variaciones dialectales de la otra comunidad. Hubo una hablante de Cusarare, Guachochi que está considerado de la misma lengua y tenía dudas sobre algunas palabras.

Autores de la ficha técnica

Maria Alfonsa Larios Santacruz.mariaalfonsa@hotmail.com

Financiamiento

Mozilla Foundation: Common Voice México.

Licencia

Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.