Common Voice Scripted Speech 23.0 - Tepeuxila Cuicatec

License icon

License:

CC0-1.0

Shield icon

Steward:

Common Voice

Task: ASR

Release Date: 9/15/2025

Format: MP3

Size: 166.43 MB


Share

Description

A collection of scripted spoken phrases in Tepeuxila Cuicatec.

Considerations

Restrictions/Special Constraints

You agree that you will not re-host or re-share this dataset

Forbidden Usage

You agree not to attempt to determine the identity of speakers in the Common Voice dataset

Processes

Intended Use

This dataset is intended to be used for training and evaluating automatic speech recognition (ASR) models. It may also be used for applications relating to computer-aided language learning (CALL) and language or heritage revitalisation.

Metadata

_ — Tepeuxila Cuicatec (cux)

This datasheet has been generated automatically, we would love to include more information, if you would like to help out, get in touch!

Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Tepeuxila Cuicatec (cux). El conjunto de datos contiene 11 horas de grabaciones (11 horas validadas) de 11 hablantes.

Información demográfica

El conjunto de datos incluye la siguiente distribución de edad y género.

Género

Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.

Edad

Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.

Muestra

A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus.

Licencia

Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.