Esta vista presenta datos cuantitativos sobre la composición del corpus CO.RA.PAN, la distribución de hablantes y la estructura de los materiales recopilados. Las estadísticas aquí expuestas reflejan el estado actual del corpus y permiten observar tanto las proporciones generales como las particularidades de cada variedad nacional.
El corpus CO.RA.PAN se compone de material oral procedente de emisoras de radio nacionales y regionales de todos los países hispanohablantes. El criterio central de recopilación es la lengua estándar hablada, tal como se manifiesta en el discurso profesional de los medios de comunicación.
Dentro del corpus, los hablantes profesionales —presentadores, periodistas y locutores— constituyen el núcleo del material analizado, ya que su producción lingüística representa el uso público de referencia. Los hablantes no profesionales —entrevistados, oyentes o invitados ocasionales— forman parte del corpus como contexto comunicativo, pero quedan excluidos del análisis estadístico y de las búsquedas principales, dado que el objetivo del proyecto es describir la norma profesional y mediática del español contemporáneo.
Por esta razón, todas las estadísticas y visualizaciones que se presentan en esta página se refieren exclusivamente a los profesionales de la comunicación.
Composición global y distribución de hablantes
Los siguientes gráficos muestran la distribución general del corpus y la composición de los hablantes profesionales según sexo y modo de producción:
Como se observa en la visualización central, los hablantes masculinos dominan claramente el corpus, representando aproximadamente dos tercios del material profesional. Esta distribución no es el resultado de una selección sesgada, sino que refleja la realidad de las emisoras de radio en la mayoría de los países hispanohablantes: en la mayor parte de las estaciones nacionales, los presentadores masculinos ocupan con mucha mayor frecuencia los espacios de mayor audiencia y formalidad.
Las grabaciones del proyecto se realizaron sin aplicar filtros de sexo, documentando la programación tal como fue emitida. Aunque en algunos países las voces femeninas tienen una presencia similar o incluso superior, en la mayoría de los casos la proporción se inclina de manera marcada hacia lo masculino, lo cual refleja con fidelidad la distribución real en la radiodifusión hispanohablante. Alcanzar artificialmente un equilibrio cercano al 50:50 requeriría una selección dirigida del material y distorsionaría la validez representativa del corpus. No obstante, con el fin de asegurar suficientes datos comparables de ambos sexos y permitir análisis sólidos sobre diferencias y convergencias en el uso profesional de la lengua, en futuras ampliaciones del corpus se procurará incrementar la proporción de voces femeninas siempre que ello pueda lograrse sin comprometer la representatividad empírica de la muestra.