Una base de datos con los partidos de todas las selecciones desde mucho antes del primer Mundial de 1930. Analítica Sports Data ofrece una “wiki-investigación” sin precedentes.

No es cualquier estadística. Es una construcción casi artesanal de absolutamente todos los partidos de selecciones de fútbol que se jugaron a lo largo de la historia. Con un detalle de cuales fueron los cruces que mayor cantidad de veces se dieron en todas las épocas. De lo cual ya damos un “espoiler”: Argentina-Uruguay.

Este dataset fue elaborado con fuentes de FIFA , The Rec. Sport Soccer Statistics Foundation   y los sitios oficiales de las asociaciones correspondientes

Se divide en dos partes: uno general y otro que incluye seis divisiones  con el detalle de las selecciones clasificadas a Rusia 2018 por CONMEBOL ( Brasil, Argentina, Uruguay, Colombia y Perú) y la presencia de México, A este ultimo puede accederse haciendo click aquí .

Un dataset de estas dimensiones puede contener errores, especialemente en aquellos partidos más lejanos en el tiempo y de menor acceso. De la recolección de datos han participado múltples desarrolladores alrededor del mundo y esta validado en referencia a las fuentes indicadas. Es un proyecto que se actualiza continuamente. Para mayor detalle pueden verse las notas al final de la nota.

La condición de local y visitante se define general (y obviamente) por donde se juega el partido, cuando se juega en un lugar neutral, de todas maneras un equipo toma el rol de “local”. Incluso eventualmente en algunos torneos esto puede afectar al verdadero local, por ejemplo Rusia por definición burocrática tomará el papel de la selección visitante en el partido contra Uruguay en el Mundial.

Recorriendo la visualizaciòn vas a encontrar diferentes filtros donde podés elegir analizar años, selecciones y torneos específicos.

 

CRÉDITOS

El procesamiento y visualización de este dashboard fue realizado por Matías Conde y el equipo de AS Data.

Los recopilación de datos es un esfuerzo conjunto de varios desarrolladores encabezados por Mart Jûrisoo, puede accederse al repositorio (y a otros análisis como los que se presentan aquí) a través del kaggle correspondiente.

 

Matías Conde

Data Scientist. Responsable de Analítica Sports Data.

Twitter