Jan Mullenberg es lecturer de análisis de datos en la Hogeschool Inholland en los Países Bajos y colabora con el medio Tussen de Linies. Actualmente desarrolla un proyecto que se basa en la construcción de una red con la totalidad de las transferencias de los futbolistas alrededor del mundo, analizando vinculaciones y trayectorias. Charlamos con el acerca de su desarrollo y el estado de la situación en cuanto a uso de datos en el fútbol de Holanda.

La industria del fútbol en general y en particular la del scouting cuenta con múltiples bases de datos . Incluso siendo muchas de ellas de acceso libre, sin embargo cuesta ver en esas plataformas los movimientos completos de una liga o de un equipo a lo largo del tiempo y su influencia real dentro del mercado global de transferencias. Desde los Países Bajos, Jan Mullenberg recogió el guante y a través de un trabajo de gran escala en cuanto a la cantidad de datos y de singularidad en cuanto a la metodología desarrolla una red de transferencias.

 

Clubes con mayor peso en el mercado de transferencias de alto volumen financiero del fútbol italiano, analizados con métricas de SNA

 

“Cuando estaba en la universidad me empecé a interesar en los distintos usos de los datos en el deporte, particularmente en el fútbol. Más tarde aprendí de manera autodidacta acerca de la ciencia de las redes y a través de esa mirada entendí que era un abordaje lógico y no muy utilizado para entender el mercado de las transferencias” .La ciencia de las redes que señala Mullenberg  es un campo de estudio en expansión con múltiples aplicaciones no solamente en el deporte  y  se centra en analizar los distintos tipos de vinculaciones entre los actores y la estructura en las cuales derivan esas redes de lazos,  por sobre las propiedades características de cada uno, como podría hacerlo la estadística tradicional.

“Partí primero de Transfermarkt que funciona como una suerte de standard de la industria, primeramente desarrolle un proceso de extracción de datos de las diferentes ligas, tratando de abarcar la totalidad de las variables incluyendo no solamente el movimiento entre club comprador y vendedor, sino también las agencias de representación que intervienen, los costos y el tipo de operación..”  Esto último es un detalle no menor, especialmente en ligas de América latina donde varios agentes tienen una presencia importante en el movimiento de jugadores entre clubes.

“Al trabajar los datos a través de análisis de redes, podemos medir no solamente quienes son los clubes que más venden y compran, sino también entender cuales son los que funcionan como intermediarios entre ligas o como paso previo a la llegada a un club de una de las Top 5 ligas del mundo..”

“Lo interesante del desarrollo, es que permite actualizarse en tiempo real e incorporar información de diferentes bases de datos a futuro; al trabajarlos a través de análisis de redes podemos medir no solamente quienes son los clubes que más venden y compran, sino también entender cuales son los que funcionan como intermediarios entre ligas o como paso previo a la llegada  a un club de una de las top 5 ligas del mundo, eso es interesante para probar si efectivamente mercados como el portugués o el holandés funcionan de esta manera o si las ligas de sudamericana proveen jugadores directamente a las ligas top europeas u otras de menor escala como aparentemente sucedió en los últimos años”En efecto, el análisis de redes permite adicionalmente mirar la estructura de los vínculos desde diferentes lugares, tanto a nivel país, como de competencia, club o incluso seguir la trayectoria de un jugador particular, generando métricas de análisis propias basadas en los vínculos que permiten complementar la mirada estadística tradicional que tiene le mercado.

 

Transferencias en la Eredivise en el mercado de 2019 (click para ver completo)

 

El análisis de redes, también conocido como network science o por sus siglas en inglés SNA (Social Network Analysis) es una metodología desarrollada originalmente desde la antropología que tiene su fundamento en la teoría de grafos de la matemática, y enfatiza en entender las relaciones que pueden darse entre un grupo de actores y la red que generan estos vínculos, en el deporte ha tenido múltiples aplicaciones especialmente en el análisis del juego de los equipos a través de los pases, entre los que se destacan los desarrollos de Jesús Lagos y Javier Buldu en España, pero también para entender las relaciones entre hinchadas como lo ha hecho Javier Bundio en Argentina, o bien el mercado de transferencias como lo que realiza Jan Mullenberg. En todos los casos, el análisis a través de lenguajes como Python o R es el denominador común: “Tanto para la extracción de datos como para el análisis he utilizado varias librerías en R, y actualmente dispongo de información a nivel jugadores, agentes y clubes de las cuales hago una extracción cada vez que hay un movimiento importante del mercado, para explicar la trayectoria de ese jugador, agencia o club en cuestión. Para que la visualización sea más intuitiva esta hecha en Shiny, que es uno de los paquetes clásicos de visualización dinámica que tiene el R”

 

¿Para que sirve analizar una red de transferencias?

  • Entender que clubes aportaron más a la conformación de un plantel de élite como el Manchester City: https://rpubs.com/janmullenberg/551462
  • Visualizar el flujo de transferencias a partir de un club clave dentro de un mercado como el Ajax  en Holanda: https://rpubs.com/janmullenberg/551443
  • Comprender el nivel de influencia en las transacciones que puede tener un agente de jugadores específico: https://rpubs.com/janmullenberg/550811
  • Profundizar en las relaciones que se generaron entre clubes en periodos largos de tiempo, detectando quienes movieron más el mercado y cuales fueron los principales movimientos: Boca tuvo un rol clave en la compra-venta de jugadores de alto valor en Argentina en los últimos 10 años, y Racing realizó una de las transferencias de mayor volumen: https://rpubs.com/janmullenberg/545844

 

El estado de las cosas en los datos del fútbol de Holanda

El avance en el uso de datos en el fútbol, especialmente en Europa y en la MLS, es un tema muy en boga en la industria. Sin embargo no todos los clubes cuentan con analistas de datos ni una estrategia desarrollada para su aplicación como podría suponerse desde afuera. Al respecto nos comenta Jan: Actualmente en la Eredivisie holandesa hay cinco o seis clubes que están trabajando con datos, el Ajax es uno de los que mejor lo hace, también el AZ, el PSV, incluso el FC Groningen.  El resto sigue siendo muy conservador y se maneja a la vieja usanza” 

¿Es por falta de presupuesto o de datos?

-Los datos están.  STATS Perform entrega tanto la data de eventos como de tracking, pero la mayoría de los clubes aún no saben que hacer con esa información y siguen manejando como antaño.

-¿Pensás que es algo que se va a mantener así?

-No, es cuestión de tiempo que los clubes se adapten y empiecen a contar con analistas como sucede en la Premier League inglesa

¿Hay alguna universidad o empresa que este formando este tipo de perfil?

-Aún no, si tenemos en varias la carrera de Sports Scientist que esta más orientada a cuestiones físicas y médicas, pero todavía no se están ofreciendo cursos de análisis de datos deportivos de juego específicamente.

 

Más información sobre los desarrollos de Jan Mullenberg aquí: https://rpubs.com/janmullenberg

 

Matías Conde

Data Analyst. Responsable de Analítica Sports Data.

Twitter