Common Voice Spontaneous Speech 1.0 - Michoacán Mazahua

Locale: mmc

Size: 212.85 MB

Task: ASR

Format: MP3

License: CC-0


Jñatjo — Michoacán Mazahua (mmc)

Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos Spontaneous Speech (habla espontánea) de Mozilla Common Voice para Michoacán Mazahua (mmc). El conjunto de datos contiene 12 horas de grabaciones (12 horas validadas) de 12 hablantes.

Idioma

La variante de Michoacán de mazahua o ‘Jñatjo’ es hablada en el norte Michoacán, México. Las tenencias donde se habla esta variante son Crescencio Morales, Boca de la Cañada, Rincón de San Mateo, El Tigre, La Barranca, La Dieta, La Fundición, Macho de Agua y Río de Guadalupe. Pertenece a la familia lingüística otomangue, subrama otopameana-central. Los datos obtenidos para este corpus de datos provienen de la tenencia de Crescencio Morales, ubicado en el municipio de Zitácuaro.

Información demográfica

El conjunto de datos incluye la siguiente distribución de edad y género.

Género

Información de género autodeclarada; la frecuencia se refiere al número de fragmentos anotados con este género.

Edad

Información de edad autodeclarada; la frecuencia se refiere al número de fragmentos anotados con esta franja etaria.

Sistema de escritura

El Mazahua de Michoacán se escribe utilizando alfabeto latino. Ha habido múltiples propuestas de alfabeto para el Mazahua y sus dos variantes, la del Estado de México (Jñajtro) y la de Michoacán (Jñatjo), las cuales no toman en cuenta los tonos de las palabras habiendo mucha confusión durante la escritura, los tonos de la lengua son sistémicos ya que pueden contrastar funciones gramaticales (posesión, demostrativos, definitud, tiempo, aspecto y modo) y determinar el significado de las palabras Por ejemplo: ‘kjǚjnü’ metate – ‘kjǜjnü’ maíz ‘‘ë̀dyi’ llevar animales – ‘ ‘ë̂dyi’ medir

Tabla de símbolos

Para esta propuesta de alfabeto, se retomará el sugerido por la Universidad Intercultural del Estado de México expuesto en la tesis de Gloria Vargas Bernal (2013). Se tiene la visión de hacerlo más específico en el caso de los tonos.

Consonantes

El Mazahua de Michoacán posee un inventario consonántico de 51 segmentos fonológicos. Hay oclusivas, implosivas, fricativas, africadas, nasales, aproximantes, laterales, vibrantes y glotales. También en estos segmentos hay realización de articulaciones secundarias como: glotalización, preaspiración, aspiración, labialización, prenasalización. En la propuesta de alfabeto para esta variante, los sonidos labializados [w] se consideran como una realización de la vocal cerrada [u], obteniendo 47 grafías.

Consonantes simples

b, m, t, s, z, ts, ch, n, l, r, rr, x, zh, ñ, y, k, g, j, ‘ (salto glotal)

Articulaciones secundarias
  • Glotalización: b’, p’, t’, d’, s’, ts’, ch’, s’, dy, k’

  • Preaspiración: jm, jn, jñ, jdy

  • Aspiración : pj, tj, sj, tsj, chj, kj

  • Labialización: En esta articulación secundaria, se hace énfasis en el uso de la consonante seguido de una vocal cerrada ‘u’. ku, ngu

  • Prenasalización: mb, nd, ndz, ndzh, ng, ngu

Vocales

El mazahua tiene inventario de 15 vocales: 9 orales y 6 nasales.

Vocales orales

Se usa diéresis en la vocal para indicar la abertura. Los símbolos en corchetes corresponden a los sonidos presentes en Alfabeto Fonético Internacional (AFI).

  • a = [a]

  • ä = [ə]

  • e = [e]

  • ë = [ɛ]

  • i = [i]

  • o = [o]

  • ö = [ɔ]

  • u = [u]

  • ü = [ɨ]

Vocales nasales

Se usa diacrítico macron en la vocal para indicar nasalidad.

  • ā = [ã]

  • ē = [ẽ]

  • ī = [ ĩ ]

  • ō = [õ]

  • ū = [ũ]

  • ǖ = [ ɨ̃ ]

En Unicode, “ǖ” tiene código 01D6 en minúscula y 01D5 en mayúscula.

Tonos (diacríticos en Unicode)

El mazahua posee cuatro tonos: alto, bajo, ascendente y descendente. Los diacríticos se escriben encima de la primera vocal. Tono alto: [ ́ ], 02CB Tono bajo: [ ̀ ], 02CB Tono descendente: [ ̂ ], 02C6 Tono ascendente: [ ̌ ], 02C6

Ejemplo: ndzíncho – Nueve jmū̀ru – Huevo pjâd'ül – Caballo jyö̌rga – Lagartija

Preguntas

A continuación se muestra una selección aleatoria de respuestas transcritas del corpus.

  1. Pjéko gí kjâ'a nú ts'índajme k'a gí sôdya? - "¿Qué haces en tu tiempo libre?"

  2. Jânge gá dyä̀tji nú sopa k'âraxü? - "¿Cómo se hace la sopa de trigo verde?"

  3. Pjéko má 'úb'i kuâjtp'ü 'ó ngéjo añimále? - "¿Qué animales ponen en los bordados?"

  4. Jânge gá dyä̀t'äji nú b'ë̌'ë? - "¿cómo hacen el tejido?"

  5. Pjéko má jñôna dyà mí né'e má kjâ'a mí ts'íjke? - "¿Qué comida no te gustaba cuando eras niño/niña?"

Respuestas

A continuación se muestra una selección aleatoria de respuestas transcritas del corpus.

  1. Má rá tûguro rí né'e rá, rá resucitágö k'a nú cuerpo de ná pjántëjë - "Quiero resucitar en el cuerpo de un venado"

  2. Má dyá gó áñima m'a 'í sump'a 'ä̀tjä yó tjö́mech'i k'o ngéjo ts'áka të́'ë, xíji tjö́mech'i kjuá'a - "En Día de Muertos, nosotros hacemos pan con forma de persona, también pan de conejo"

  3. À jñíñi mí b'ǚb'ü ná, ná ndíxu ñe ná b'ë̌zo yá mí xîrabi mí sìpji ná xútǐ'i - "En el pueblo, había una mujer y un hombre que tenían una niña pequeña"

  4. Rá, rá, rí né'egö rá kjâ'a nú pjántëjë - "A mí me gustaría ser un venado"

  5. Nú ndíxu mí kjë́jmé à k'a ngǔm'ü mí 'ä̀t'ä jñôna mí pà'a k'a ndáreje pa pédye b'íjtu - "La mujer salió de la casa, antes de calentar la comida y fue al río a lavar la ropa"

Posprocesamiento recomendado

El sistema de escritura propuesto para esta variante de mazahua queda abierto a futuras modificaciones y comentarios.

Agradecimientos

  • Colectivo 'Jñatjo Ndixu', Santa Martha del Sur, Coyoacán, Ciudad de México.

  • Maestros Silverio Benítez García y Orlando Blanco y alumna María del Carmen de Jesús Guzmán, integrantes de Puntos de Innovación, Libertad, Arte, Educación y Saberes (PILARES), Ciudad de México.

  • Coordinaciones de Posgrado y Licenciatura de la Universidad Autónoma Metropolitana, Unidad Iztapalapa. Gracias por todo el apoyo recibido y por habernos brindado el Laboratorio de Lingüística (D110) para llevar a cabo nuestras grabaciones.

  • Mtro. Edgar Alberto Madrid Servin, coordinador y docente de la Licenciatura en Lingüística y Dr. Lucio Armando Mora-Bustos, docente e investigador de Lingüística, ambos de la Universidad Autónoma Metropolitana, Unidad Iztapalapa. Estamos totalmente agradecidos por su orientación y comentarios.

Autores de la ficha técnica

Rosario de Fátima Álvarez García: fatimaalvarezgr96@gmail.com Juan Castro Gallardo: jcgallardho@gmail.com Lorena Abigail Benítez Cruz: abigailbenitez66@gmail.com

Licencia

Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.