Clasificación de las ligas profesionales españolas. Aplicado xG y xP

Artículo realizado por: Carlos García Moreno e Ignacio Blas

xP y xG son dos métricas que en los últimos años han estado de constante actualidad en todo lo relacionado con el Big Data y el Análisis Deportivo de Datos.  Este artículo tiene como objetivo servir como  acercamiento a ambos conceptos y conocer cómo trabajar con ellos.

Son numerosas las noticias respecto a las decisiones que pueden tomar diferentes Federaciones y Ligas profesionales por todo el mundo sobre la posibilidad o no de concluir sus competiciones propias y, en su caso, la forma de acabarlas. Francia anunció el fin de todas sus competiciones profesionales. Desde fiebreFútbol nos hemos planteado, como fundamento de este artículo, ante una hipotética imposibilidad de acabar LaLiga SANTANDER y SMARTBANK cuál debería ser la clasificación final de ambas competiciones de acuerdo a estas métricas. La segunda parte de este estudio se centrará en las grandes Ligas europeas.

Acercamiento al término:

Primeramente, debemos clarificar qué se entiende por xP y xG.

xP (expected points/puntos esperados): son el número de puntos que se espera que un equipo haya ganado según los datos de objetivos esperados.

xG (expected goals/goles esperados): son el número de goles que se espera que un equipo o jugador marque en función de la calidad y la cantidad de tiros realizados. Lógicamente, no siempre el xG coincide con el resultado final. En definitiva, el xG estima la probabilidad de que un disparo finalmente sea gol. Dependerá del modelo creado por el analista que el xG contenga una serie de factores y no otros.

El analista de datos deportivo puede crear su propio modelo de xG y xP o trabajar con los datos que le provean diversas herramientas. En el primer caso ¿cómo se obtienen los valores de xG?: Como se explica en Statiskicks estos serían los pasos a realizar:

  1.  “Para analizar la probabilidad de cada disparo, se debe tener una base de datos confiable de todos los disparos de la liga que se quiera analizar”.
  2.  “Calcular la probabilidad de cada disparo”.
  3.  Se pondera “cada variable que influye en la definición”.
  4.  Estas variables pueden ser: “Distancia a la portería / Ángulo de disparo / Parte del cuerpo con la que se hizo el golpeo. / ¿Cómo se creó la ocasión? (contraataque, jugada a balón parado, centro) / ¿Hubo regate antes de la asistencia o del disparo?”. Estas son algunas de las variables pero como hemos indicado será el propio analista quién modele su valoración con la introducción de otras variables.

Statiskicks

Una vez obtenidos los valores se procedería a calcular los mismos. Una página que os recomendamos y en la que se pueden realizar estos cálculos es la de Danny Page

Danny Page

Realizada la simulación tendríamos los xG de un equipo o jugador. Como podemos ver este cálculo nos da un porcentaje de victoria (xP). Analizando los duelos de un equipo respecto al resto obtendríamos el xP de un partido, serie de partidos o de una competición en su conjunto.

En nuestro estudio, hemos analizado las métricas que proporciona InStat respecto a xG y xP para la Liga SANTANDER y LaLigaSMARTBANK. Las métricas que utiliza son las siguientes:

  • xG (Expected goals)
  • Opponent’s xG
  • Net xG (xG – Opponent’s xG) (siguiente gol esperado)
  • xG conversion
  • xG per shot
  • Opponent’s xG per shot
  • xG per goal
  • Opponent’s xG per goal

Instat ofrece la valoración de xG por equipos y su xP. De acuerdo a ello, ¿qué equipo debería proclamarse campeón y/o jugar competición europea? ¿qué equipo debería descender?¿quién debería ascender o jugar playoff? Para el caso de la LaLiga SANTANDER este sería el resultado:

Sin título-1

Podemos ver en esta gráfica que varios equipos tienen más puntos de los realmente esperados: FC Barcelona (+10), Getafe (+9), Real Sociedad (+8), destacando sobre el resto los dos equipos de la ciudad de Valencia: Valencia CF (+17) y Levante (+12). Por el contrario, Leganés (-9) y Espanyol (-10) son los que más diferencias reflejan en negativo. Solo en un equipo, Atlético de Madrid con 45, coinciden los puntos reales y su xP.

Respecto a LaLiga SMARTBANK esta es la gráfica resultante trabajando con los datos ofrecidos por Instat:

Sin título-1

En LaLigaSMARTBANK los dos primeros clasificados en el momento de suspenderse la competición son dos de los equipos de mayor diferencia entre los puntos obtenidos y su xP: Cádiz (+12) y Real Zaragoza (+9). Mirandés que según el xP debería ocupar el puesto 20º con 30 puntos ocupa el puesto 7º con 42 puntos (+12). Lo mismo puede decirse del Elche, que con unos puntos reales de 46 (+14) ocupa el 6º puesto que da derecho a jugar PlayOff de Ascenso.

Girona y Málaga hacen coincidir los puntos reales y su XP 47 y 38 respectivamente.

En el balance negativo de xP en LaLiga SMARTBANK destanca el Rayo Vallecano (-7): debería ocupar la 2ª posición. El Fuenlabrada tendría un (-6) que le haría estar en plazas de play off. Por la parte de abajo, Deportivo, Lugo y Numancia tienen un (+7) teniendo una mejor posición que la estimada por sus xP.

¿Quieres formarte en el área del BigData?

Aquí te ofrecemos nuestro minicurso de Scouting de Datos

Curso-de-Scouting-de-datos-495x400