Una primera final abierta, con muchos goles y cambios de dominador durante los 90 minutos. La confirmación de que son dos equipos eficaces por sobre todas las cosas, y de que podrá ser mayor la percepción de la construcción del juego de River pero los datos muestran equipos muy parejos.

Una nueva entrega de ANALITICA SPORTS LAB, donde los datos son el medio para hablar del juego. Empezamos por una visión general de lo que fue el partido, para luego ir profundizando en cada indicador tradicional y finalmente presentar dos métricas “nuevas”: los goles esperados (xG) y el análisis de redes. La idea, como siempre, es  buscar entender si hubo algún equipo que mereció más y cuales fueron los jugadores claves en el circuito de juego. Utilizar los datos para ir mas allá del resultado. Empecemos por el principio:

Boca tiene más la pelota de lo que se comunica

El problema habitual que tiene la posesión de balón como indicador, es que siendo una variable dinámica, suele presentarse como estática. Es decir, vemos fotos parciales de la tenencia (incluso no las finales durante el partido, dado que el ritmo de codificación de pases siempre va algo más atrás que las transmisiones de televisión) y no la película entera.

Ejemplificando esta cuestión desde los datos, la cuestión no es el número final (53%-47% en favor de Boca para Wyscout y 52-48% para Opta por citar dos de los proveedores más importantes), donde la diferencia para el equipo xeneize es leve, sino que si se analiza por tramos, el local tuvo la pelota en una mayor cantidad de segmentos durante el partido, especialmente en el segundo tiempo:

 

La clave de abrir el indicador por tramos, es que permite lo que Miguel Simón llama el “debate en segunda instancia”, empezar a pensar porque se dió este dominio de Boca, si el mismo fue buscado, se impuso o si River le cedió la posesión y no quedarse con la sensación de que, dada ciertas características del juego de los de Gallardo, son estos los que tienen la posesión mientras Boca pregona el juego directo. El dato adicional marca que el equipo local, tuvo picos de 80-20 y 60-40 en los últimos dos tramos de cinco minutos del partido.

Más datos sobre el juego de construcción de River y Boca:
  • La cantidad de pases y la efectividad de uno y otro fue similar (ver cuadro inicial)
  • El promedio de pases por posesión fue similar: 3.88 Boca y 4.01 de River
  • La longitud media de los pases de uno y otro también fue pareja: 22.1 Boca y 20.4 River
  • Especialmente la distribución por tipo de de pases enfatiza la paridad, tal como vemos en el gráfico:

Paridad en cuanto cantidad y calidad de las llegadas

Similar cantidad de remates para uno y otro en general, y leve ventaja para River en cuanto a disparos que van efectivamente al arco (5-4 en favor de los de Gallardo). El arquero Rossi tuvo 4 atajadas contra 2 de Armani.
Hasta hace unos años el análisis terminaba en la oración anterior, pero hoy podemos tomar los goles esperados (xG) para ver quien realizó remates de mayor calidad, y ahí aparece una leve ventaja para el local, al menos en el modelo de la cuenta @11tegen11:
Recuerden que el nombre de la métrica no debe engañarnos, no se trata de predecir el resultado sino de analizar la calidad de cada uno de los remates cruzándolo según las circunstancias en la que se dio (como fue la jugada, en que lugar fue el remate, etc) con una gran base de datos de registros similares.
De manera complementaria web colombiana GolyFútbol aporta un resultado 0.86 a 0.84 para Boca, en ambos casos la paridad (y la menor cantidad de anotaciones) son factores salientes. Explicando desde ejemplos prácticos el indicador, la enorme tapada de Armani en el final, y un remate posterior a una acción a balón parado por parte de Izquierdoz en ataque, fueron dos situaciones de alto porcentaje de xG que Boca no supo capitalizar.
Por ultimo, pero no menos importante, recuerden que los goles en contra suelen no contabilizarse en esta clase de modelos, por lo que este escenario de paridad hay que ponderar levemente a River para un análisis más robusto.

Pelota parada: el punto que no pudieron resolver las defensas.

Lo anticipamos en la previa y quizá estemos ante el dato más saliente de este análisis, efectivamente a ambas defensas les cuesta (y mucho) defender los envíos de balón detenido.

Boca tuvo 10 envíos con pelota detenida (5 córners y 5 tiros libres) que terminaron en remate o rechazo, en 6 de ellos se impusieron jugadores xeneizes. A River le fue todavía mejor: ganó en 5 (2 tiros de esquina y los 3 tiros libres) de los 6 que tuvo.

¿Que tan conectados estuvieron los equipos?

El armado de mapas de pase ( #passmaps si los quieren buscar en Twitter) es bastante habitual por parte de los científicos de datos  interiorizados en el fútbol, no tan común aunque ya lejos de ser una novedad, es aplicar métricas del análisis de redes sociales o SNA a dichos mapas.

Visualmente a la distribución de los jugadores en el campo, se agrega la chance de ver rápidamente los vínculos (pases) entre los jugadores. El mayor tamaño indica que el jugador tuvo mayor centralidad que en este contexto equivale a decir que dio y recibió más pases de sus compañeros. Veamos entonces como quedaron las redes de uno y otro en el Superclásico en este análisis:

 

Boca muestra Pablo Pérez como nodo/jugador central, y mucha participación de sus laterales. Interesante lo poco que entra en juego W. Barrios y la mayor tendencia la salida vía el vínculo Magallán/Olaza.

 

 

River muestra mucha participación de Pinola y Martinez Quarta en la sálida, el rol clave de Exequiel Palacios en el medio y Borré acaso haciendo parte del trabajo sucio, más participativo que Pratto.

 

El análisis de redes permite, entre muchas otras cosas, correlacionar a los diferentes jugadores según los vinculos que tuvieron y establecer subgrupos o clusteres al interior, es decir que grupo de jugadores se conectaron mejor entre sí. El algoritmo, para quienes gustan de los tecnicismos se llama Concorr y los resultados graficamente son los siguientes (los colores marcan la pertenencia a cada subgrupo):

 

Boca con cluster por el centro, lo que muestra que los jugadores que eran salida por los costados no estuvieron tan bien conectados con quienes organizan el juego en el medio del campo.

 

 

River con otro tipo de partición, con Pratto menos participativo pero involucrado en el eje de más juego.

 

 

Las métricas del análisis de redes, como explicamos en otras ocasiones, además de aplicarse a los equipos, pueden darnos información de jugadores específicos. Son múltiples los indices que se utilizan, por lo que repasaremos sólo algunos de ellos:

Intermediarios: Se base en la métrica de intermediación o betweenness y apunta al jugador que conecta a la mayor parte de su equipo, es decir no necesariamente el que más tiene el balón o el que más pases da, sino el intermedia dentro de la red para involucrar a los distintos sectores de la misma. Para que se den una idea Manu Ginóbili cumplía esa función en los Spurs.

En ambos equipos hubo bajo nivel de intermediación, en el poco tiempo en cancha, Ignancio Fernández combino con buena parte de sus compañeros, sin embargo los que enlazaron líneas fueron Casco y Montiel aunque con niveles bajos. W. Barrios y P. Pérez, también con niveles bajos para el indicador fueron los más destacados en Boca.

PageRank: Es una métrica que establece, en este caso, la probabilidad de que la pelota pase por un jugador dadas las conexiones que hay en el equipo. Es una manera distinta de calcular quien es el jugador central en un conjunto, aquí lo que se tiene en cuenta es que tanto participan los jugadores con los que se tiene más vinculo. En River, los lideres del PageRank son Borré, Palacios y Pratto (jugadores ofensivos), en cambio en Boca son Pérez y Nández, un escalo por debajo aparece Olaza.

ANALITICA SPORTS LAB ofrecerá más análisis cuando se juegue la vuelta el 24 de noviembre, como siempre tratando de poner los datos al servicio del juego e ir más allá de los resultados.

Fuentes

Matías Conde

Data Scientist. Responsable de Analítica Sports Data.

Twitter