Desde Madrid, Driblab concentra información de diferentes proveedores, abarcando casi la totalidad de datos que se generan en las ligas del mundo. Desarrolla informes y consultoría a clubes y agencias de scouting de todo el mundo. Contamos como trabaja el hub madrileño de la compañía.

Se repite hasta al cansancio la idea de que en la industria deportiva cuenta cada vez con mayor cantidad de datos, pero también que faltan análisis para aprovecharlos. Justamente en el punto medio de ese dilema es donde se inserta Driblab, una compañía española de datos deportivos. A diferencia de empresas como STATS Perform, DataFactory o StatsBomb , Driblab no captura los datos:  se concentra en el resto del proceso de análisis, generado reportes e insights ad hoc para clubes y scouters de todo el mundo.

“Existen varios proveedores de datos, inicialmente trabajamos con Opta (N: Ahora STATS Perform) y luego, a medida que íbamos expandiendo nuestro alcance a otras competiciones, empezamos a incluir otras empresas, al día de hoy creemos que nuestra cobertura abarca la totalidad de las ligas y eventos que generen datos, tanto a nivel clubes como de selecciones”,  explica Cristian Coré Ramiro, uno de los fundadores de Driblab y actualmente Head of Technology de la compañía.

-En cuanto a eventos no todos los proveedores tienen las mismas definiciones, por ejemplo existen diferencias en el concepto de recuperación para STATS y Wyscout ¿Cada reporte lo generan en base a las características del proveedor original de datos?

-No, necesitamos que toda la información que contamos sea comparable entre si, por lo que en nuestra base lo que hacemos es normalizar los conceptos entre proveedores, especialmente los cuestiones como las gambetas u otros eventos donde hay más diferencias entre compañías. En consecuencia, nuestro esfuerzo no está en la captura del dato donde entendemos que ya hay varias empresas realizando un buen trabajo, sino en la compatibilidad, el alcance y el análisis de la totalidad de la información disponible.

 

A diferencia de empresas como STATS Perform, DataFactory o StatsBomb , Driblab no captura los datos: se concentra en el resto del proceso de análisis, generado reportes e insights ad hoc para clubes y scouters de todo el mundo.

 

Scouting y Análisis de Performance

“Somos una empresa que mayormente se dedica al scouting, asesoramos a dirigentes de distintos clubes pero también trabajamos con agencias y agentes independientes. Les brindamos un servicio de consultoria donde generamos reportes especificos en función de las necesidades y características que buscan los clientes, con quienes estamos en contacto permanente tanto a través de reuniones recurrentes como a través de Whatsapp o el medio más inmediato por el cual requieran información” comenta Santiago Riveros, Head of Business Development de la compañía.

¿Cómo es el proceso de extracción y análisis de la información?

Cristian Coré Ramiro: Tenemos las API de los distintos proveedores, las cuales parseamos y aplicamos distintos algoritmos para normalizar los datos como  contábamos previamente. Adicionalmente obtenemos información de los jugadores de fuentes secundarias, como la prensa, datos oficiales de los clubes y todo lo que nos permita enriquecer y obtener un perfil completo tanto de los futbolistas como de los basquetbolistas:  en Driblab también cubrimos todo lo referente al baloncesto.

Todo esto lo concentramos en una base relacional, actualmente utilizamos PostgreSQL para almacenar los datos, luego los indicadores se generan de diferentes maneras, algunos con procesos dentro de la misma base, otros a través de lenguajes de programación y finalmente el front esta desarrollado en Javascript, utilizando la libreria d3.js

 

 

 

 

Wyscout o SmarterScout ofrecen los datos a través de una plataforma interactiva, y por lo que me contás ustedes también la tienen desarrollada, sin embargo no eligen presentar sus reportes a través d ese medio ¿Por qué tomaron esa decisión?

Nosotros ofrecemos principalmente un servicio de consultoría, por lo que conocemos muy bien a nuestros clientes y sabemos que tipo de entregables va a funcionar mejor para que pueden tener la información de manera más clara y detallada. Además cualquier dato adicional que precisen estamos conectados diariamente con ellos y podemos pasarle el detalle adicional sin que tenga que ser el propio usuario el que entre a una plataforma a buscarlo.

Goles esperados y métricas avanzadas

Driblab ganó popularidad en parte por los desarrollos propios y las revisiones de métricas standards que se manejan, al respecto Santiago Riveros detalla: “Nos dedicamos principalmente a hacer análisis descriptivos, no tanto predictivos. Hemos desarrollado versiones propias de los modelos que utiliza habitualmente la industria, tanto para recomendar jugadores a partir de la similitud con otros o con características especificas buscadas por los dirigentes, como también de métricas como los goles esperados (xG)”

Hablábamos de que no es el centro de su empresa el análisis predictivo, pero “goles esperados” suena un poco a eso…

Supongo que tiene que ver con la traducción, lo cierto es que es un indicador de probabilidad y no un algoritmo predictivo de machine learning.

 

 

Cuando comparo el modelo de goles esperados de ustedes con otros proveedores o analistas, suele ser el que más desvió tiene ¿Que es lo que tiene de diferente?

Cristian Coré Ramiro: Estamos particularmente orgullosos de nuestro modelo, tiene en cuenta un nivel de detalle exhaustivo que quizá no se vea en el que manejan otros analistas, tomamos tanto las características de la jugada, el remate, la posición de los defensas, la del arquero y varios detalles adicionales.

Lo medimos permanentemente y sabemos que es uno de los que mejor correlaciona con la realidad, particularmente hemos analizado los datos de los últimos cinco años de La Liga y los resultados son muy buenos. De hecho, en nuestro afán por mejorarlo hemos trabajado en conjunto con científicos de la Universidad Computense de Madrid, pero por ahora no han surgido detalles que permitan obtener resultados más contundentes.

Respecto a su famoso radar que utilizan para mostrar rendimientos de los jugadores ¿Utilizan algún tipo de algoritmo de recomendación para generarlo en sus consultorías de scouting?

No utilizamos un algoritmo de ese tipo, lo que hicimos fue ponderar las estadísticas del futbolista en una gran cantidad de eventos que varían según la posición del jugador y van más allá de las que se muestran en la gráfica de radar que haces referencia. Esta ponderación esta validada en nuestros frecuentes intercambios con dirigentes, agentes y actores claves de la industria, creemos que es simple de entender y muy útil a la hora de elegir un jugador.

 

Más información en la web de Driblab –> driblab.com

 

Matías Conde

Data Analyst. Responsable de Analítica Sports Data.

Twitter