En los últimos años, los datos y las estadísticas tienen un mayor predominio en el mundo del fútbol. A la vanguardia de esto se encuentran los goles esperados (o xG). Desde que Sam Green de Opta introdujo xG en 2012, la métrica se ha convertido en una de las más difundidas y esclarecedoras en el análisis del fútbol.
Tras ser adoptada en un principio por los mercados profesionales y de apuestas, la métrica de goles esperados representa, actualmente, una herramienta habitual de los principales medios de comunicación como Sky Sports y BBC, en su programa “Match of the Day”. Los xG han trascendido de los portátiles de analistas a ser mencionados por los entrenadores de Premier League. El técnico del Liverpool, Jurgen Klopp, comparó recientemente su desempeño en cuanto a goles esperados con el del Manchester City, mientras que Dean Smith, del Aston Villa, utilizó esta métrica con frecuencia en entrevistas esta temporada para hablar sobre el desempeño de su equipo.
Los goles esperados es una de las primeras métricas avanzadas que se ha dado a conocer ampliamente entre los aficionados del fútbol y, como es inevitable, ha enfrentado sus críticas con el pasar de los años (ver la opinión de Jeff Stelling en 2017). Una batalla entre la vision tradicional del deporte y el mundo del análisis de datos por venir. Sin embargo, antes de emitir nuestro juicio, es importante entender cómo funciona la métrica y cómo debe utilizarse.
¿Qué son los goles esperados (xG)?
Los goles esperados (o xG) mide la calidad de las ocasiones, calculando la probabilidad de que esta se transforme en gol y teniendo en cuenta la posición específica en el campo durante un momento determinado de la jugada. Este valor está basado en distintos factores previos al remate. xG se mide en una escala de cero a uno, donde ‘cero’ representa una ocasión de la que resulta imposible anotar, mientras que con ‘uno’ se espera que el jugador marque siempre.
Sabemos que de una ocasión desde el centro del campo no se espera el mismo resultado de cara a gol como de una ocasión dentro del área. De hecho, con xG, podemos cuantificar la probabilidad de que un futbolista anote en cada una de estas situaciones del juego. Por ejemplo, supongamos que la ocasión dentro del área, precedida por un conjunto de características previas al tiro, es de 0.1 xG. Esto significa que se espera que un jugador promedio anote uno de cada diez remates de este tipo, o el 10% de las veces.
La terminología puede que sea nueva, pero este tipo de expresiones han sido utilizadas por aficionados del fútbol y comentaristas años antes de introducirse la métrica – “ese jugador anota eso en nueve de cada diez ocasiones” o “debería haber anotado un triplete”.
Conceptos erróneos más comunes
La mayor crítica a los goles esperados (xG) aparece, a menudo, en escenarios en los que la métrica no se aplica correctamente. El error más comun es a nivel del juego. Que un equipo tenga un xG mayor en un partido no implica que, necesariamente, debió haber ganado el encuentro. La métrica simplemente se basa en la calidad de la ocasión generada y no en el resultado final del compromiso. Así como sugiere el dicho, los goles alteran los partidos y el marcador incluye en la forma de jugar de los equipos. Si un conjunto toma la ventaja tempranamente, este ya no ‘necesitaría’ generar más ocasiones y esperaremos que el equipo rival sí lo haga, en busca de una remontada teniendo en cuenta el resultado.
Otra idea equivocada está relacionada al nombre literal de la métrica. No “esperamos” que los goles ocurran exactamente como lo indican las probabilidades. También entendemos que las fracciones de gol no son posibles de materializar. El nombre “goles esperados” proviene del concepto matemático “valor esperado”, que mide la probabilidad de que un determinado hecho ocurra. El valor esperado de una moneda al aire es del 50% para que salga cara y 50% para que salga cruz (las caras esperadas o las cruces esperadas son de 0,5). No esperamos con esto que la moneda caiga de cada lado exactamente la mitad de las veces, pero al realizar cada vez más lanzamientos es probable que se genere ese equilibrio. Lo mismo aplica para los goles esperados. La varianza del valor esperado es inevitable, por lo que esta es una información valiosa que podemos analizar en el fútbol.
Un jugador o un equipo que ha tenido un rendimiento mayor a lo que sugería su índice xG, no necesariamente debe empeorar para cumplir con las expectativas. Este en su concepto que se conoce como “la falacia del apostador”. Mientras esperaríamos que su rendimiento goleador retrocediese hasta estar a la par de las expectativas en sus siguientes remates, el equipo ya ha ‘depositado’ ese rendimiento mejorado, por lo que ya tendríamos en cuenta este nuevo desempeño en el agregado de la temporada. Del mismo modo, si un lanzamiento de moneda cae de cara diez veces seguidas, las probabilidades de los siguientes seguirán siendo iguales entre sí (50%-50%), aunque las diez caras seguidas ya hayan ocurrido.
¿Cómo se calculan los goles esperados?
Mientras vemos un partido, podemos decir, por intuición, qué ocasiones estuvieron más cerca de convertirse en gol. ¿Qué tan cerca estaba el jugador de la portería? ¿Remataron desde una posición favorable? ¿Fue una acción mano a mano? ¿Fue una ocasión de cabeza?
Lo difícil es que existe un promedio de 25 remates por partido que debemos desgranar, todos en situaciones potencialmente únicas. La ventaja de nuestro modelo de goles esperados es que ahora podemos tomar variables como las descritas, entre otras, y cuantificar cómo cada una de estas afecta la probabilidad de que se anote un gol o no. Esto nos permite así valorar, en cuestión de segundos, la calidad de las ocasiones en base a los 9.398 tiros realizados en la temporada 2019-20 en Premier League.
La métrica xG de Stats Perform está construida usando un modelo de regresión logística, alimentado por cientos de miles de remates del registro histórico de datos de Opta e incorporando un número de variables que afectan la probabilidad de que un gol se materialice. Algunas de las más importantes se muestran a continuación:
- Distancia de la portería
- Posición de remate
- Mano a mano
- Ocasión clara
- Parte del cuerpo (p. ej., cabeza o pie)
- Tipo de asistencia (p. ej., balón filtrado, centro, pase hacia atrás, etc.)
- Tipo de jugada (p. ej., jugada abierta, contraataque, libre directo, saque de esquina, saque lateral, etc.)
Reconocemos que algunas de las situaciones son particularmente únicas, por lo que se modelan de manera independiente. Los penaltis tienen un valor constante, correspondiente a su promedio de conversión en general (0,79 xG); los libres directos cuentan con su propio modelado; las ocasiones de cabeza se valoran de manera diferente si provienen de acciones a balón parado o en jugadas abiertas.
Desde que inició la temporada 2017-18, los datos de eventos detallados de Stats Perform incluyen la potencia de un tiro y su claridad en cada acción de remate, midiendo de manera explícita la fuerza de este y el posicionamiento de los defensas y el portero del equipo rival. Esto potenciará una próxima versión del modelo.
¿Cómo podemos utilizar los goles esperados?
Comparemos dos jugadores en base a su rendimiento en la temporada 2019-20: Gabriel Jesus del Manchester City en Premier League y Hakan Calhanoglu del AC Milan en Serie A. Ambos realizaron exactamente 100 remates esa campaña (sin incluir penaltis), pero anotaron 14 y 8 goles respectivamente. Entonces, ¿qué diferencia hubo entre sus remates?
Al cuantificar la calidad de las 100 ocasiones de cada futbolista, xG añade un contexto adicional a los remates que hayan superado las métricas tradicionales, como los remates a puerta o la distancia promedio de tiro. Ahora podemos medir la calidad de las ocasiones de cada jugador.
Tomando en cuenta las ocasiones que tuvo Gabriel Jesus, esperaríamos que un jugador promedio anotase alrededor de 18 goles (17,7 xG). Por otro lado, de las ocasiones de Hakan Calhanoglu esperaríamos solo 7 tantos (7,0 xG). Podemos comprender inmediatamente por qué sus cifras goleadoras son tan diferentes. A pesar de que Jesus superó las expectativas y Calhanoglu no, por poco, sus 100 ocasiones fueron muy distintas en cuanto a la calidad, algo que se refleja en el resultado.
Podemos comparar el registro de remates de ambos jugadores observando su valor de goles esperados por tiro (o xG por tiro), que valora la calidad media de las probabilidades de gol de un jugador. El xG por tiro de Gabriel Jesus es de 0,18, lo que significa que se esperaba un gol suyo por cada cinco remates que ejecutó. El carácter especulativo de los tiros de Calhanoglu resultaron en un xG por tiro mucho más bajo (0,07), evidente en el gráfico anterior, donde el tamaño creciente de los puntos indican un valor xG en aumento (y por ende, una probabilidad mayor de anotar).
Aquí nos enfocamos en el ejemplo individual de un jugador, pero la métrica de goles esperados puede aplicarse también a equipos en general o a un partido en específico. Por supuesto, podemos ver que un futbolista o equipo puede anotar más o menos veces que lo que sugiere su valor de xG, pero esta es exactamente la varianza que ahora podemos analizar. ¿Está anotando un jugador menos veces de las que debería? ¿Quién está generando ocasiones a partir de situaciones con un alto valor de xG?
Profundidad de los goles esperados
El fútbol es un deporte con una cantidad de anotaciones relativamente baja, por lo que nuestra habilidad para medir la probabilidad de anotación es un trabajo de contexto que resulta esencial. Con los goles esperados, estamos aportando otra herramienta a los expertos y analistas para cuantificar las historias que cada aficionado a este deporte quiere oír. ¿A qué delantero le está costando definir? ¿Qué equipo deberían estar más arriba en la clasificación?
La profundidad sin rival de los datos de Stats Perform permite que ahora tengamos más de 2.500.000 remates enriquecidos con valores de xG, de más de 66.000 jugadores, que nos permite comparar y comprender el desempeño de futbolistas y equipos de todo el mundo. Los xG es una métrica que va más allá del tradicional conteo de remates, aunque es importante tener en cuenta que sigue siendo solo una métrica. Podemos utilizarla para evaluar rendimientos, pero son los goles en sí los que determinan el ganador de un partido. El fútbol es impredecible y las anotaciones pueden venir de formas diversas e inesperadas, pero gracias a los goles esperados podemos explicar qué tan inesperadas fueron estas.