Una larga trayectoria en la industria de los datos y el deporte avalan a Dan Altman, cuya ultima gran apuesta es Smarterscout, una plataforma de scouting accesible para todo tipo de usuarios con información detallada y análisis originales de jugadores provenientes de ligas todas partes del mundo. Conversamos con Altman para conocer más sobre su plataforma y su metodologia.

Dan Altman, Doctor en Filosofía de Harvard y fundador de Smarterscout.com y North Yard Analytics

¿Cualquiera puede scoutear?

-El scouting suele ser terreno de especialistas: ex jugadores, directores técnicos dedicados específicamente a la tarea o analistas con un perfil muy determinado, sin embargo la plataforma que desarrollaste tiene un perfil abierto, incluyendo opciones más usuarios generales o incluso para fanáticos del fútbol ¿Esta fue una política buscada a la hora de desarrollarla? ¿Qué características crees que tienen los buenos scouters?

-Desde el principio, la idea de la plataforma no sólo era brindarles un servicio de mucha utilidad a los profesionales, sino también abrirles el mundo del análisis avanzado a las hinchas, a los jugadores de ligas de fútbol fantasía (Nota: Juegos como “El Gran DT” en Argentina, “ESPN Fantasy” en Estados Unidos) y  también a la gente que se interesaba por el análisis en si. Por eso tenemos una opción de acceso gratis con 27 ligas y las herramientas básicas del sitio. Hay una segunda para los usuarios algo más sofisticados que buscan información complementaria y una específicamente para profesionales de la industria que incluye la totalidad de las herramientas y ligas.

Para mí, los buenos scouters ,y no importa si usan datos, video, o son ojeadores que van al estadio, tienen una cosa en común: son consistentes. Siempre califican a jugadores de la misma manera, sus gustos no cambian, y pueden identificar las misma características en todos los futbolistas que siguen. Estos scouters podrían formar parte de un algoritmo racional para tomar decisiones de reclutamiento.

“Para mí, los buenos scouters, y no importa si usan datos, video, o son ojeadores que van al estadio, tienen una cosa en común: son consistentes

¿Cuales fueron los criterios a la hora de construir la base que alimenta la plataforma? Abarcan gran cantidad de ligas y supongo que eso los obligo a trabajar con diferentes proveedores de datos ¿Hay un protocolo de normalización y unificación de la información? ¿Cómo ven la calidad de los datos especialmente en ligas que no tienen el nivel de cobertura máximo por parte de los proveedores?

-Tenemos un solo proveedor de datos  y tenemos el mismo nivel de cobertura en todas las ligas que presentamos en el sitio. Invertí varios meses personalmente en explorar los datos y desarrollar los métodos de pre-procesamiento necesarios para poder usarlos en la plataforma. Este proceso involucró muchas horas comparando los datos con el video que correspondía a los mismos momentos de los mismos partidos. Ahora todos los datos pasan por cientos de lineas de código para normalizarlos y unirlos a los datos que ya tenemos cargados. Y todo este trabajo se hace antes de que los procesemos con nuestros algoritmos que generan las calificaciones.

-Más allá de las estadísticas descriptivas sobre las tendencias de los jugadores, buena parte de sus desarrollos están en los modelos matemáticos para medir la influencia en los resultados ¿Crees que el fútbol es un juego más predecible de lo que su historia y sus fanáticos admiten? ¿Pensás que se ha vuelto más predecible en los últimos años o la diferencia es que ahora contamos con datos para poder contrastarlo?

-El fútbol sigue siendo un deporte muy difícil de predecir. Hay pocos goles en un partido y muchos factores idiosincrásicos pueden influir en el resultado. Pero en el rendimiento de jugadores se puede encontrar algunas tendencias persistentes.  Al poder acceder y procesar cada vez más datos estas tendencias se vuelven más claras. Me refiero no sólo a la cantidad de información que se genera hoy sino también a los datos históricos que hemos ido acumulando en el historial. El historial es imprescindible para poder evaluar y calibrar nuestros modelos matemáticos.

El fútbol sigue siendo un deporte muy difícil de predecir al nivel de un partido (…) pero en el rendimiento de jugadores se puede encontrar tendencias persistentes

Donde Nacen las Estrellas

Popularmente se asocia el scouting a los clubes en su faceta compradora.  En América Latina en cambio, las ligas funcionan más como exportadoras: el slogan de la Superliga Argentina es “Donde nacen las estrellas” ¿Cómo ayudan plataformas como smarterscout a clubes que tienen características exportadoras? ¿Crees que hay conocimiento y aprovechamiento de estas herramientas por partes de los dirigentes?

-Para los clubes exportadores, lo importante es saber a quién le podría interesar un jugador. Por eso, la capacidad de evaluar los puntos fuertes y débiles de clubes en otras ligas, y de ver cómo un futbolista podría encajar en aquellos clubes, es muy importante. Esto implica también la posibilidad de predecir el rendimiento de un jugador en otra liga, para poder fijarle un precio justo. En smarterscout los usuarios Pro tienen exactamente estas herramientas. Ya tenemos clubes y federaciones de fútbol en más de veinte países como usuarios en la plataforma, y estamos tratando de correr la voz sobre ella.

Los analistas de datos más exitosos tienen una combinación de habilidades: construir modelos matemáticos, crear estadísticas basadas en esos modelos, escribir código para generar las estadísticas, presentarlas con visualizaciones, y comunicar sus mensajes

-Llevas muchos años en la industria de análisis de datos y deporte, sin embargo tu formación no es específicamente en ciencias “duras” sino que venís de la Filosofía y las ciencias sociales ¿Pensás qué existe un perfil determinado para quien aspira a trabajar como analista de datos en el fútbol? ¿Qué herramientas consideras primordiales para quien busca desarrollarse en esta industria?

-No hay ningún perfil determinado, eso es seguro. Los analistas de datos más exitosos tienen una combinación de habilidades: construir modelos matemáticos, crear estadísticas basadas en esos modelos, escribir código para generar las estadísticas, presentarlas con visualizaciones, y comunicar sus mensajes. Nadie es especialista en todas. Y la gente que viene de otras áreas – la bioestadística, la climatología, la física de partículas – siempre trae nuevas ideas que enriquecen el campo. De hecho, entre los analistas más conocidos, son pocos los que crecieron en el fútbol. Pero como resultado, en los clubes muchas veces hay una grieta entre los analistas y los entrenadores que se cierra sólo con una mentalidad abierta y el apoyo de los dirigentes.

Tres análisis para conocer smarterScout
1. Similitud entre jugadores (y versiones específicas de los mismos)

El caso del Betis fichando a Lo Celso a través de un modelo de similitud con Fabián, fue noticia hace un par de años por lo novedoso del proceso y porque, deportiva y financiaremente, los resultados fueron buenos para el club español. smarterscout pone a disposición un herramienta de comparación por similitud, donde ingresando un futbolista “target”  la base trae aquellos que estadísticamente son más parecidos en ligas de distintos lugares del mundo.

Lo interesante es que el modelo ajusta por temporadas particulares y modelos de competencias, por ejemplo si Boca busca un reemplazante a Fabra, basándose en el rendimiento del colombiano en una de sus mejores temporadas (17/18) la base sugiere estos nombres:

Obviante se puede filtrar, para ajustar a ligas y mercados específicos. Un herramienta simple y con mucho potencial, no solamente para toma de decisiones en clubes, sino también un interesante complemento tanto para los seleccionadores nacionales como para jugadores empedernidos con el Football Manager o El Gran DT.

2. ¿Quien debería patear el tiro libre?

Vieja discusión futbolera durante los partidos, que jugador es el encargado de la pelota parada dependiendo en la zona donde se ejecuta. smarterscout, con machine learning aplicado, elaboro un modelo que marca cual es el futbolista optimo para hacerse cargo. Aquí el caso de la Juventus, con Dybala tomando ventaja cerca de frente y cerca del área y Cristiano Ronaldo “relegado” a posiciones especificas desde la izquierda

 

3. ¿Quién debería jugar en determinada posición?

Regularmente smarterscout sube artìculos aplicando sus análisis a casos concretos, por ejemplo ¿Quien deberia jugar por derecha en el Manchester United? Contrastando números y presentando infografías de su plataforma de las diferentes variantes del equipo. Conclusiones sorpresivas y buenas prácticas para presentar datos deportivos en contexto.

Se puede leer completo (en inglés) en https://smarterscout.com/articles/manchester-united-anthony-martial-bruno-fernandes-mason-greenwood-daniel-james-premier-league

 

Matías Conde

Data Analyst. Responsable de Analítica Sports Data.

Twitter