El primer apocalipsis de los tiros contextualizados



Hoy hablaremos de un tema que desembocó en los modelos xG (goles esperados) así como los conocemos hoy. Les platicaremos del contexto de los tiros a gol y, al final, les presentamos el efecto al predecir total de goles en una liga. 

Este tema nos lleva a los inicios de los 2000. En esos tiempos, se buscaba un índice que ayudara a predecir el desempeño de los equipos fútbol. Algunos analistas de datos trajeron al mundo del futbol métricas utilizadas en hockey. El principal de esos índice fue el Corsi. Llamado así en honor al bigote de Jim Corsi. Sería equivalente a si llamáramos a un índice el Tuca.

 
Michael Caley trabajó con diferentes modificaciones de TSR (Total Shots Ratio) o "el Tuca". Primero trabajaba con el total de tiros. Después, solo consideraba los tiros que iban a portería. Esta distinción no tiene sentido en hockey, pues si el tiro no va a portería el disco sigue estando en zona de peligro. 

La idea de Caley era que "los mejores equipos hacen tiros que son más probables que sean gol". Los equipos están intentando crear diferentes tipos de oportunidades y diferentes decisiones para crear tiros más probables de terminar en gol. Había una pieza que le faltaba. Para encontrar esta pieza, Caley seguía considerando los tiros como parte fundamental de sus análisis, pero ahora probó con diferente tipos de contextos. 

Al final, Caley encontró tres tipos de contextos que hacían diferencia en sus proyecciones:

  1. La zona del tiro: ¿de dónde era hecho el tiro? ¿qué tan lejos de la línea de gol o del centro de la portería.
  2. El tiro y tipo de asistencia: ¿el tiro era con la cabeza? si sí ¿el pase venía de un centro o no? ¿El pase venía de un centro pero el tiro no es con la cabeza? ¿El tiro es después de una finta? Y por último,
  3. La rapidez de la jugada.
Este tipo de consideraciones son las que ahora definen los distinto tipos de modelos de xG. Cada empresa tiene sus propias métricas. Métricas más sencillas como los pases claves también tienen definiciones distintas dependiendo del proveedor de datos. 

En nies.futbol pusimos a prueba la idea de agregar contexto. Consideramos modelos de xG que solo consideren la posición del tiro y modelos que agregan el contexto de cada tiro. Esto lo hicimos para 4 ligas en la temporada 2022-2023. Las ligas son la Premier League, Serie A, La Liga y Eredivisie.

Los resultados fueron los siguientes:
  1. En la Premier League al considerar contexto, el error porcentual pasó de 17.6 a 4.2%
  2. En la Serie A al considerar contexto, el error porcentual pasó de 13.2 a 4.5%
  3. En La Liga al considerar contexto el error porcentual pasó de 2.1 a 4.9%
  4. En la Eredivisie al considerar contexto el error porcentual pasó de 19.2 a 6.6%
Con esto acabamos por hoy. El objetivo era platicar un poco de qué cosas podían considerar los modelos de xG. En otra nota les platicaremos de las diferencias en las predicciones de desempeño al considerar diferentes modelo de xG. Bonito inicio de Champions para todos 🤙🏿.                                                                 

Comentarios

Entradas más populares de este blog

Gráfica de desempeño de jugadores

Las magas del gol

¿Cuál es el equipo con el mejor promedio de goles por tiempo de las ligas europeas?

¿Cómo utilizamos el tipster de nies?🤑

El valor en las puestas de fútbol

¡Justa tabla, justa!

El Gegenpressing Reinventado: Más Allá de las Estadísticas Tradicionales

Hasta entre los campeones hay niveles

¿Que tan bueno es atacar en España?

Consistencia en las alineaciones: la visualización