Common Voice Scripted Speech 23.0 - Seri
License:
CC0-1.0
Steward:
Common VoiceTask: ASR
Release Date: 9/15/2025
Format: MP3
Size: 208.51 MB
Share
Description
A collection of scripted spoken phrases in Seri.
Specifics
Considerations
Restrictions/Special Constraints
You agree that you will not re-host or re-share this dataset
Forbidden Usage
You agree not to attempt to determine the identity of speakers in the Common Voice dataset
Processes
Intended Use
This dataset is intended to be used for training and evaluating automatic speech recognition (ASR) models. It may also be used for applications relating to computer-aided language learning (CALL) and language or heritage revitalisation.
Metadata
_ — Seri (sei)
This datasheet has been generated automatically, we would love to include more information, if you would like to help out, get in touch!
Esta ficha técnica corresponde a la versión 23.0 del conjunto de datos de voz guiada de Mozilla Common Voice para Seri (sei). El conjunto de datos contiene 11 horas de grabaciones (11 horas validadas) de 16 hablantes.
Información demográfica
El conjunto de datos incluye la siguiente distribución de edad y género.
Género
Información de género autodeclarada, frecuencia se refiere al número de clips anotados con este género.
Edad
Información de edad autodeclarada, frecuencia se refiere al número de clips anotados con este rango de edad.
Muestra
A continuación se muestran cinco oraciones seleccionadas aleatoriamente del corpus.
Licencia
Este conjunto de datos se publica bajo la licencia Creative Commons Zero (CC-0). Al descargar estos datos usted acepta no determinar la identidad de los hablantes en el conjunto de datos.