Consultar el corpus

El corpus CORMA (Corpus Oral del Español Hablado en Madrid) es una colección de español oral espontáneo grabado en Madrid. Forma parte de una iniciativa de investigación más amplia sobre la variación y el cambio en el español contemporáneo. El corpus tiene como objetivo proporcionar datos con base empírica para el estudio de fenómenos pragmáticos, sintácticos y sociolingüísticos en la conversación natural.

Contenido corpus

Los materiales incluidos aquí corresponden a las versiones seudonimizadas de las conversaciones grabadas, distribuidas como archivos de texto sin formato (.txt).

Cada archivo contiene:

  • Una breve sección de metadatos que especifica información sobre las personas participantes en la conversación (p. ej., código, edad, género, clase social)
  • La transcripción ortográfica de la propia conversación.

Archivos metadatos

Dos archivos Excel adjuntos proporcionan metadatos detallados e información cuantitativa:

CORMA21_metadatos_conversaciones.xlsx

Contiene metadatos estructurados sobre las conversaciones en su conjunto, entre ellos:

  • Códigos de conversación y estructura de los identificadores
  • Período de grabación
  • Contexto o situación discursiva
  • Número de participantes
  • Distribución por generación, género y clase social

Download conversaciones excel

CORMA21_metadatos_hablantes.xlsx

Proporciona información cuantitativa sobre las personas hablantes, entre ella:

  • Rasgos sociodemográficos (edad, género, clase social, situación discursiva)
  • Número de palabras producidas por cada hablante en el corpus

Download hablantes excel

Consideraciones éticas y metodológicas

Todos los archivos han sido seudonimizados para proteger la privacidad de las personas participantes, de acuerdo con las directrices éticas institucionales. La información personal se ha eliminado o se ha sustituido por códigos neutros.

Grabaciones y transcripciones

Download corpus

Descargo de responsabilidad

Los datos del corpus solo deben utilizarse con fines académicos. Al obtener acceso a los datos, se aceptan los siguientes términos y condiciones de uso:

  • No se pueden distribuir, publicar, transferir y vender públicamente los datos sin el permiso explícito por escrito de los creadores del corpus.
  • Cuando se utilicen los datos en trabajos académicos, presentaciones, congresos, etc., asegúrese de eliminar cualquier dato personal que pueda contener el extracto, para no violar la privacidad de los participantes.
  • Es obligatorio citar el corpus.

El acceso al corpus puede ser revocado si existen pruebas de que un usuario no ha respetado estas condiciones.