Analítica Sports Data reconstruye el partido desde los datos: Mascherano dio más pases en un circuito en el que no participa Messi. La estrella argentina jugó poco con Meza, el que se supone era su socio creativo.

Argentina no pudo con Islandia el sábado y el análisis post partido dejo mucha tela para cortar. En AS Data recopilamos buena parte de la información disponible y le damos un enfoque distinto para que ante la abundancia de datos no falte el análisis.

De atrás para adelante: Conclusiones basadas en los datos del partido

Analizando diferentes indicadores, algunos habituales y otros no tanto, los datos arrojan algunos puntos sobre los cuales profundizamos en el informe:

  • Argentina dominó cuantitativamente, llegó más y tuvo más la pelota. No trasladó este dominio al ámbito cualitativo, los goles esperados (xG) influenciados por los bloqueos islandeses así lo demuestran.
  • Islandia mostró una versión algo más extrema de su juego habitual, cedió la posesión algo más que de costumbre (22% contra un 30%-40%)  y mostró la efectividad que los llevo a pasar rondas en al Euro 2016.
  • Argentina se volvió previsible, en parte por la escaso movimiento de sus volantes por afuera, que concentraron su juego en el mismo sector y se conectaron poco entre ellos. Los mapas de calor esta vez funcionan como una referencia clara.
  • Argentina tuvo alta eficacia en cuanto a los pases, incluso en aquellos que se dan en el último tercio del campo. Sin embargo la conexión más habitual se dio entre Rojo y Mascherano, y el 5 se volvió el eje del equipo que tuvo pocos intermediarios entre líneas.
  • A Messi lo buscaron pero generó pocas sociedades recíprocas, concentrando su pases en el Kun Agüero y con menos juegos en los costados.

En el fútbol el dato general describe y el particular explica

En general cuando utilizamos datos para contar y analizar lo que sucede dentro de un campo de fútbol (o incluso en otros deportes), la crítica es que los números no siempre reflejan lo que pasa en el partido. Si nos quedamos con las estadísticas tradicionales (presentadas en el cuadro de abajo) del partido de Argentina, no hacemos otra cosa que darles la derecha a quienes piensan que los datos no agregan nada: El equipo de Sampaoli llegó más, pateo más al arco, hizo casi cinco veces más pases que el rival y casi no perdió efectividad en los vínculos entre compañeros, incluso en el último tercio del campo donde siempre es más difícil sostener la precisión ¿Por qué pese al dominio Argentina no se llevó el partido, y más aún, cuales son los motivos por los cuales nos quedó la sensación de que había pocas que el equipo albiceleste pudiera doblegar a los islandeses? Hay que profundizar en los datos para entenderlo.

Goles esperados vs Tiros al Arco: Big data para definir la calidad de las llegadas

Hay una métrica relativamente nueva dentro del análisis del fútbol cuya traducción es “goles esperados”, viene del inglés expected goals y suele resumirse como xG. El nombre pareciera esconder cierta capacidad predictiva pero se trata de un indicador más potente como forma de análisis de la calidad de los tiros realizados que otra cosa. Si bien hay diferentes modelos para calcularlos (y en próximas notas volveremos sobre esta cuestión), en resumidas cuentas se toma la posición desde donde se hizo el remate (por zona o grilla) y se cruza con una base de datos de partidos globales de más de 300.000 remates estableciendo el porcentaje de probabilidad de convertir desde ese lugar del campo. Pueden ver más detalle en este vídeo o en este otro si se manejan un poco con el inglés.

 

 

El modelo de Opta (una de las grandes empresas que proveedoras de datos deportivos junto a Stats) tiene en cuenta adicional mente la posición de los defensores. Tomando estos parámetros (zona de tiro + lugar de la defensa), los resultados de los xG de Argentina fueron realmente bajos como lo muestra el mapa que subió el usuario @11tengen11 a Twitter. En la lectura tengan en cuenta que a mayor tamaño de los circulos, mayor es la probabilidad histórica de que esos remates terminen en gol, en consecuencia los tiros efectuados por Messi y compañía eran de escasa calidad, fundamentalmente por los bloqueos que realizó la defensa islandesa.

Dato extra: Si no tenemos en cuenta el penal, el xG esperado de Argentina y de Islandia es 0.95 y 0.98 respectivamente, el dato en este caso queda muy alineado con el resultado final.

 

Para tener conceptualmente más claro la idea de xG, las visualizaciones del usuario @Caley_graphics nos permiten comparar los mapas de xG de Agentina y Brasil, y podemos notar que la calidad de la llegada de los de Neymar es bastante superior:

 

Dinámica de lo esperado, Islandia cedió la posesión y terreno ¿Cómo medir la falta de sorpresa de Argentina?

El equipo nórdico no sorprendió con su planteo sino que hizo una versión extrema de su juego habitual, revisamos los últimos partidos relevantes y notamos que sea cual fuera el resultado, Islandia cede la posesión de la pelota y ataca menos que sus rivales. Que haya avanzado en la última Euro y logrado clasificado para el mundial indican también que es un equipo más efectivo que la media (rara vez patea más de cinco veces al arco rival):

Ahora bien, estas estadísticas ya se sabían y más allá de la particular aplicación a rajatabla de Islandia ¿En que falló el juego Argentino? Un punto es la falta de sorpresa para romper a los esquemáticos nórdicos y que puede verse a través de los mapas de calor, una estadística que puede parecer confusa en alguna representación pero que comparada marca, por ejemplo como no hubo cambios de zona por parte de los volantes argentinos que rara vez se cerraron para abrir la cancha con los laterales.

La comparaciones son injustas, y haciendo la salvedad de que posicionalmente no juegan exactamente de lo mismo, puede observarse un tipo de despliegue diferente en Iniesta y David Silva en la selección española contra Portugal, que en lo hecho por Di María y Meza en Argentina – Islandia.

 

 

¿Quien se la toca a quien? El intermedio es clave en el juego de equipo

En el comienzo de este reporte veíamos que Argentina hizo muchos más pases que Islandia, analicemos ahora de que manera se distribuyo la pelota al interior del equipo argentino utiliznado algunos indicadores propios del análisis reticular o social network analysis cada vez más habitual en los passmaps.

La idea, que en la NBA tiene un análisis similar llamado assist-networks, es considerar al equipo como una red de vínculos donde cada jugador es un nodo y los pases la relación entre ambos, a mayor es la cantidad de toques entre dos fútbolistas mayor es la intensidad de ese lazo y se refleja en esta primer infografía que publicará La Nación y puede verse completa acá

La Nación: https://www.lanacion.com.ar/2143260-estadisticas-de-argentina-islandia-pases-tiros-al-arco-y-el-recorrido-de-los-jugadores

Vayamos más al detalle, perdemos interactividad pero ganamos datos, a al red de pases la hacemos más específica, dividimos entre pases dados y recibidos y le damos un tamaño a la representación de cada jugador tomando en cuenta el nivel de intervención en el partido:

 

Como podrán notar, la pelota paso por Mascherano más que por ningún otro futbolista argentino, y Rojo tuvo más participación en cuanto a pases dados y recibidos que Messi. Previsiblemente, la relación más habitual entre dos jugadores de Argentina fue la de Rojo y Mascherano.

Pero todavía hay más, si corremos un algoritmo para identificar clusters, es decir subgrupos al interior de la red en función a una estructura común (por ejemplo, que se hacen más pases entre sí en conjunto), vamos a encontrar a Messi por fuera del cluster central (el detalle esta en la primera imagen de la galeria a continuación). Y si nos enfocamos puntualmente en los vínculos de Lionel encontramos particularidades como que recibió mucho de Mascherano y jugó más pelotas para Agüero (13) que para Meza (4), su socio a priori en la construcción de los ataques argentinos (segunda imagen).

 

 

¿Que otras cosa nos dice el análisis reticular aplicado al fútbol además de mostrarnos gráficamente que jugadores son más centrales en base a los pases dados y recibidos (indicador de centralidad)? Por esta vez les vamos a presentar dos indicadores más, medir la autoridad de un jugador dentro del equipo (no solo tomando la cantidad de pases que da sino quienes son sus receptores y las conexiones que estos generan). Para más adelante dejamos intermediación, es decir el jugador que conecta más compañeros aunque no necesariamente es el que da mas pases. Por ejemplo en España Sergio Ramos es quien más pase da, pero los intermediarios son Iniesta y Busquets. ¿Que sucedió en Argentina? Algunos gráficos a continuación (para hacerlos más simples se muestran re-escaldados de 0 a 1, donde 1 es el de mayor score en el indciador:

¿Se puede medir el volumen de juego en el fútbol?

Una punta para los fanáticos de los datos, las métricas más avanzadas por ahora (y solamente por ahora) vienen de desarrollos del viejo continente y se basan en jugadas determinadas (tiros, atajadas, pases gol) como por ejemplo los xG que vimos más arriba. En Argentina hace años que buscamos definir como medir un concepto muy habitual en nuestros técnicos: el volumen de juego.

Cuantificar eso que a veces falta y otras aparece, que todos entendemos a que refiere pero que ninguno podría explicarlo sin polémica. Si tomamos solamente los pases, la densidad de la red puede funcionarnos como una métrica proxy (cercana en idioma corporativo). Argentina contra Islandia estuvo en 0.68 (1 es el ideal, donde todos los jugadores están conectados con todos y en 0 no hubo conexión alguna), para que tengan de parámetro Grecia del 2004 que ganó la Euro jugado la bochazo tenía niveles de densidad de 0.41 y el Barcelona de Pep en el otro extremo superando la marca de 0.90 .

Así como esta el indicador parece quedarse corto porque refleja sólo una faceta del juego ¿Y si lo combinamos con los xG? Habrá mas novedades en esta línea de la mano del equipo de AS Data.

 

Fuentes para este informe

Herramientas Utilizadas

  • Tableau Public – Visualización datos generales
  • R Studio + ORA – Visualización de redes.
  • Flourish Studio – Visualizaciones Islandia e indicadores SNA.

 

Matías Conde

Data Scientist. Responsable de Analítica Sports Data.

Twitter