lunes, 21 de junio de 2010

Economía, estadística y el mundial


Inspirados por los vientos de las vuvuzelas mundialistas, hemos revisado una serie de datos que calcula la FIFA en cada partido de los que se han jugado en el mundial (ver acá). Este tipo de indicadores y estadísticas buscan reflejar el desempeño de los jugadores en lo individual, pero también en lo colectivo. El grado de sofisticación es realmente llamativo para el caso del fútbol (en otros deportes como el football americano o el baseball esto es normal), al punto en el cual, incluso se calcula un índice de desempeño (el Índice Castrol, ver aquí la presentación).

Lo interesante de este trabajo estadístico es que se calcula partido a partido, por lo cual se puede considerar un esfuerzo empírico casi en "tiempo real". Según este indicador al 21 de junio de 2010, el país con mayor probabilidad de ganar el mundial es Brasil (con 22.6%), el segundo es Holanda con un 15.7% y en tercer lugar España con el 12.7%. Sorprendentemente a la selección de Argentina le otorgan un 10.2% (poco menos de la mitad de Brasil) y a México le dan un 3% de ser campeón del mundo.


Tabla 1: Índice Castrol de la Copa del Mundo


Este pronóstico es contrario al realizado por la compañia de videojuegos EA Sports (ver acá), que daba como favorita a la selección de España, basándose en múltiples simulaciones de su videojuego FIFA World Cup 2010. Esta empresa también sostiene que la final será ganada por España con marcador de 3-1 sobre Brasil, que el primer equipo en ser eliminado es Sudáfrica, que el goleador del torneo será David Villa de España con 7 goles y que el mejor jugador será Kaka de Brasil.

Para alivio de los mexicanos en el predictor de EA Sports, se presenta un marcador para el partido contra Uruguay de 2-1 favor México (ver acá). Sin embargo, aunque México pasa, es eliminado por Argentina con un marcador de 2-1 (ver la tabla 2) eso si, dando un partidazo. La diferencia entre el simulador de EA Sports y el índice de Castrol es que mientras en el primero se modelan las características de cada jugador y posteriormente se simula el partido, nunca se reciben datos del desempeño real de los jugadores (PE: lesiones, bajas de juego, depresiones) o eventos fortuitos como las pifias producto de la madición del ya tristemente célebre balón Jabulani.


Tabla 2: Simulación de resultados de la Copa Mundial de EA Sports


Para el caso del Índice de Castrol, como se comentó es calculado cada que se verifica un partido, por lo cual recibe retroalimentación que modifica los pronósticos día a día. Los datos para México al día 21 de junio de 2010 (sin contar el partido con Uruguay) son los siguientes (ver gráfica 1) :

1) La probabilidad de pasar a la siguiente ronda es de 97.1%
2) La posibilidad de cuartos de final se reduce al 44.2% (este es el famoso quinto partido) lo cual considerando el partido inaugural no parece ser tan malo y podría justificar el haber comprado la pantalla plana.
3) El llegar a semifinales tiene una probabilidad del 21.8%
4) Llegar a la final con un 8.1% de probabilidades
5) Ser campeón: 3%


Gráfica 1: Desempeño de México en Sudáfrica según el Índice Castrol


¿Por qué cae tan drásticamente la probabilidad de México?. Como en cualquier evento probabilístico, el teorema de Bayes importa y todo depende en que lugar se clasifique en su grupo. Siguiendo con las simulaciones de Castrol en la Gráfica 2 se puede ver que si es primero de grupo se enfrentaría a Corea del Sur, después a Serbia, a Brasil y finalmente a España. Esto implica que de inicio nuestro equipo enfrentaría dos rivales aparentemente débiles (Corea y Serbia) para después medirse con dos equipos campeones. En cambio si se califica como segundo el siguiente partido sería contra Argentina y caso de ganar seguirían Inglaterra, España y Brasil.

Gráfica 2: Ruta de México para ser campeón del mundo

Finalmente, la predicción para el partido del Índice de Castrol contradice a la estimación de EA Sports pues resuta más probable un triunfo de Uruguay con un 42%. Para los optimistas, la probabilidad de que México gane o empate es de 58% (31% un triunfo sobre Uruguay). La conclusión que se puede obtener de este análisis es que el Índice de Castrol puede ser "altamente volatil" (¿que pasa si el Chicharito mete mañana tres goles?) por una serie de resultados sorpresivos que se han dado. Como en todo modelo estadístico, los mejores pronósticos se dan mientras más cerca está el futuro por lo que podríamos ver la verdadera eficiencia del índice en la siguiente ronda. Es una lástima que no se incluyeran en los cálculos errores estándar o bien la base con la cual se realizó el índice.

Bueno este post está dedicado para los que piensan que las Matemáticas y Estadística son aburridas.

PD. Para los curiosos, aunque no existe una sección sobre metodología del Índice de Castrol, muy seguramente se emplea el análisis multivariante, en particular componentes principales. Para el caso de las probabilidades deben ser modelo logit o probit. Esto debería ser aliciente para estudiar a detalle dichas técnicas.

2 comentarios:

Verónica dijo...

Asi es Nacho, estamos en el mundial; se agradece que le pongas algo de ciencia al deporte más aburrido de la galaxia (por que a mi me gusta el automovilismo, en donde la estadística y la pericia humana son de incalculable valor, pues la suerte NO EXISTE). Saludos desde Xalapa, Ver.

Ignacio Ibarra dijo...

Verónica:
No te preocupes mucho por el tema del futbol, parece que el 5to. partido se va a complicar más de lo que se pensaba. Nos toca Argentina para el domingo. El lunes 28 regresaremos a la normalidad.
Es interesante que el Índice de Castrol pronosticó una derrota para México y esto es lo que ocurrió. Tomando el mismo simulador de Castrol, se puede ver que la probabilidad de que Argentina nos gane es del 50% mientras que la de que ganemos es del 25% (http://www.castrolfootball.com/?set_team=200). Con todo, buena suerte a la selección el próximo domingo.