martes, 11 de julio de 2017

Cómo predecir el futuro usando matemáticas

Ganarle a los momios


La trilogía de Volver al Futuro reúne tres de mis películas favoritas de todos los tiempos. Aunque las tramas que involucren viajar en el tiempo prácticamente siempre están plagadas de inconsistencias y problemas con la lógica de las consecuencias, hay una cosa que retratan a la perfección: si pudiéramos viajar al pasado, encontraríamos la manera de ganar millones en el proceso. 


Eso es justamente lo que hace Biff del futuro, robando el plan de Marty de apostarle a quien ya sabe que va a ganar (aunque, extrañamente, no le toca vivirlo porque él sí puede, quién sabe por qué, regresar a su línea del tiempo intacta mientras que, pese a cambiar el pasado, Marty no se desvaneció ni nada parecido como sucedió en la primera y todas esas apuestas nunca alteraron el futuro escrito en el libro ni nada pareciOK OK OK, ya). 

Seguro que a nadie le molestaría conocer los números ganadores de la lotería o saber quién ganará el siguiente Super Bowl antes de que inicie la temporada. Bueno, no poca gente cree saberlo y por eso las casas de apuestas son una industria de miles de millones de dólares anuales.




Algunos expertos lo hacen a ojo de buen cubero, como lo hace cualquier analista deportivo que propone una quiniela de fin de semana. Otros lo hacen con el apoyo de un enorme conocimiento de estadísticas deportivas, como el famoso @2010MisterChip (Alexis Martin Tamayo; ESPN, AC, Marca), quien no solo llenará tu TL de impresionantes datos, 


también tiene su propio club de paga para ayudarte a saber cómo apostar. Ya es cosa de cada quién si deciden creerle o no. 

Por supuesto, muchas otras personas están dentro del negocio de predecir el futuro. Esta entrada es en parte consecuencia de haber terminado de leer Fútbol y Matemáticas, de David Stumper, libro que me prestó Yogui y terminé comprando porque mis perritas le mordieron toda una esquina. 


Vamos a concentrarnos en el rating Elo y hablar un poco del Soccer Power Index de ESPN, que diseñó originalmente Nate Silver de Fiverthirtyweight en 2009. La cadena deportiva tiene otros índices similares, como el FPI, Football Power Index, que es una manera de comparar equipos de fútbol americano colegial, pues juegan en ligas diferentes, contra rivales diferentes, calendarios diferentes y, sin embargo, necesitan elegir a los mejores porque así lo decidió la raza humana. 

La idea es sencilla: crear un sistema para comparar objetivamente cuál equipo es mejor. Piensa, por ejemplo, que los videojuegos como FIFA tienen integrado un sistema de clasificación de modo que si dejas que juegue la computadora, en 9 de cada 10 ocasiones el Cruz Azul quedaría subcampeón. 


La segunda idea no es muy complicada: asignar puntos a las acciones y resultados que impactan directa y proporcionalmente al desempeño de un equipo. Esto permite comparar equipos que debería ayudarte a decidir un ganador en un enfrentamiento directo. 

La implementación es una pesadilla. Debe quedar claro que es sumamente complicado separarse de la subjetividad propia de asignarle un valor y que es exageradamente complicado medir factores emocionales, la ventaja de la localía, etcétera. Sin embargo, los valores que se asignan se pueden refinar en retrospectiva para que mejor se ajusten a los resultados. 

Hablando de Rankings


Si no pudiéramos hablar de si Messi es mejor que Cristiano pero no mejor que Maradona, si la Selección Mexicana es buena pero no tanto como la de Francia '98, si Agassi o Sampras, Nadal o Federer, si LeBron puede hacerle sombra a Jordan y los Warriors 2015-2016-2017 son mejores que los Bulls de 93-94-95, el Barcelona de Ronaldinho, el Real Madrid de los galácticos o el Necaxa de Alex Aguinaga; en fin, si no habláramos de qué equipo, deportista o atleta, probablemente tendríamos 70% menos pláticas entre nosotros. Es sencillamente demasiado interesante y entretenido. 



Prácticamente todos los deportes tienen alguna manera de clasificar a sus mejores deportistas en el último año calendario, las clasificaciones históricas se dejan a historiadores y periodistas del deporte, y a encuestas que generan el 87% del tráfico de sitios deportivos. La FIFA/Coca-Cola tiene una clasificación que encabeza el Campeón del Mundo por un tiempo (pues asigna muchos puntos); la W/ATP tiene un ranking que se actualiza semanalmente y que entrega puntos por cada torneo, mismos que caducan exactamente un año después. 



Ninguno de ellos debe considerarse un buen predictor; al menos para el tennis, sirve mucho más como criterio de entrada a los grandes torneos y, si fuera un buen predictor, las clasificaciones serían permanentes y la única manera de subir/bajar sería por ausencias. Por lo mismo, el ranking W/ATP puede no ser el mejor para medir el talento real y puede ajustarse; piensa que la clasificación no pudo habernos preparado para ver a Rafael Nadal de vuelta como número 2 del mundo, después de haber empezado el año como 9no y no haber estado en esa posición desde octubre 2014. (Federer empezó el año como 17mo y ya está de vuelta en 5to lugar.) 

El ranking usado para ajedrez se llama Elo (a veces ELO, esperando no se confunda con la banda de rock progresivo Electric Light Orchestra) en honor de Arpad Elo, físico húngaro. El sistema que propuso terminó por suplantar el sistema Harkness oficialmente en FIDE en 1970, diez años después de que se empezara a usar oficialmente en Estados Unidos. Desde entonces, su sistema se usa también en prácticamente cualquier deporte desde Fútbol, Fútbol Americano, Tennis y Scrabble. El puntaje Elo de algún equipo con frecuencia está en desacuerdo con el ranking oficial de la federación: México aparece en lugar 16 en el Ranking FIFA pero en lugar 11 según su puntuación Elo, que básicamente quiere decir que es un poco más fuerte de lo que el Ranking sugiere (en parte porque Polonia, Bélgica y Suiza son mucho más débiles de lo que el Ranking dice, que también subestima fuertemente a España). 



Cómo funciona Elo


Al inicio de la Copa Confederaciones, Portugal tenía 1909 puntos contra 1907 puntos de México. Eso quiere decir que, en apariencia, eran igual de buenos y su empate en el primer partido era predecible, de modo que su puntaje se mantuvo intacto. Cuando Portugal venció a Rusia (1683) le robó 17 puntos mientras que México le robó solo 6 puntos a Nueva Zelanda (1551) porque, en el papel, era mucho más sencillo el rival de nuestros ratoncitos verdes. El 24 de junio, México le ganó a Rusia y le robó los mismos 16 puntos, pero Portugal -que para entonces tenía un puntaje más alto que México y Nueva Zelanda uno más bajo- le robó 10 puntos porque si bien era predecible una victoria lusa, el marcador de 4 por 0 demuestra mayor fuerza que las demás victorias por la mínima. 

Para cuando México se midió a Alemania en semifinales, su rating era de 1931 puntos (había también subido 2 por haberle ganado a Ghana) contra los 2032 de Alemania. Es decir, las probabilidades de que México venciera a Alemania eran más altas que las de que México hubiera perdido contra Rusia o Nueva Zelanda. Cuando se volvieron a encontrar por el tercer lugar, México tenía 1905 puntos (perdió 31 contra Alemania y le ganó 5 a Paraguay) contra los 1937 de Portugal: la diferencia ahora era un poco más amplia, pero el empate era bastante predecible (Chile y Portugal se enfrentaron con solo 12 puntos de diferencia).


Este larguísimo ejemplo solo muestra que los puntos se roban y que la magnitud de la pérdida o la ganancia depende de la diferencia original (ganas más puntos si ganas a un rival mucho más fuerte que tú que si vences a alguien más débil). Pero ya también reconocimos una enorme debilidad: México sumaba puntos incluso si eran dos equipos completamente diferentes jugando; México empezó la Copa Oro con 1882 puntos, tras los puntos que le robaron Alemania y Portugal y que solo podría recuperar si le gana a Costa Rica y Estados Unidos, los dos rivales más fuertes (Curazao tiene 1200+ puntos que la coloca como 142 del mundo). 

El sistema que propuso originalmente Elo es muy sencillo en parte por dos suposiciones que hizo entonces, debido al poder computacional de la época. (Es tan sencillo su sistema que se puede calcular el resultado en lápiz y papel.) Las sofisticaciones y complicaciones que se le hacen a su sistema intentan reflejar de mejor manera el poder de los equipos. Elo supuso que la habilidad de un jugador en un juego dado es una variable aleatoria de distribución normal y su habilidad real es la media de sus actuaciones. 


La idea es sencilla: si le ganas a un rival, tu actuación fue mejor; si pierdes, fue peor; si empatan, fue idéntica. Esta es la maravilla del sistema Elo: se corrige solo. El puntaje Elo permite predecir la cantidad de victorias después de un torneo o temporada; si ganas menos, tu puntaje se ajusta hacia abajo, si ganas más, hacia arriba. 

El puntaje Elo (en fútbol) tras un partido se actualiza como sigue: 

R_n = R_0 + K * (W - W_e)

donde R_0 es el rating antes del juego, W es el resultado del juego (1 para victoria, 0 para derrota y 0.5 para empate), W_e es el resultado esperado y K es una constante que pesa la importancia del partido o torneo. 

El resultado esperado W_e se calcula como sigue: 

1 / (10 ^ (-dr / 400) + 1)

donde dr es la diferencia en ratings entre los equipos, más 100 puntos para el equipo local. En un torneo sin localía, observa cómo una diferencia de 0 equivale a un resultado esperado de 0.5, es decir, un empate; una diferencia de 400 puntos representa una probabilidad de victoria del 90% para el mejor equipo y sube a 99% con 800 puntos de diferencia. (En la Copa Oro 2017, México tiene más de 400 puntos que Jamaica, Martinica, El Salvador, Guyana, Nicaragua y Curazao, más de 300 que Canadá y Honduras e incluso más de 100 que Costa Rica y Estados Unidos.)

La constante K se ha definido como 60 para la Copa del Mundo, 20 para amistosos y 50-40-30 para los partidos de en medio. Esto le da un peso diferente a cada partido según su importancia. 

Jaque mate

Eso está muy bien para el ajedrez pero, ¿cómo se adapta al fútbol? Cuando ESPN debutó su Soccer Power Index, este es el artículo que publicó Nate Silver explicando cómo funcionaba. Acá tenemos otro más y uno sobre el Club Soccer Projections. Incluso usan a México como un ejemplo clásico: ¿contra cuál México te enfrentas: selección A, selección B, equipo sub23 con esteroides?



El fútbol tiene sus complicaciones propias. Piensa en la cantidad de estadísticas que se muestran en cada instante de un partido  de la NBA o la NFL y compáralo con lo que sabes de un partido de fútbol ya sea Liga Mx o Champions League. Es mucha menos información. Más datos permitirían ajustar los índices Elo de maneras diferentes y predecir cosas mucho más específicas

Por ejemplo: se puede mejorar si cada equipo o jugador en el torneo tiene una desviación típica distinta entre sí, es decir, algunos equipos son más impredecibles que otros. 

Las predicciones que hace Fivethirtyeight para cualquier deporte asignan la puntuación Elo y corren 10,000 simulaciones por computadora; en algunas mantienen los ratings intactos, en otras se van actualizando según las reglas propias. Con esto pueden hacer predicciones que convierten en las probabilidades que publican en sus entradas. 


El Soccer Power Index es realmente interesante. Es un modelo pensado para comparar selecciones nacionales de fútbol que no es sencillo por la cantidad de cambios o rotaciones que hay en cada partido, que pueden depender de lesiones, de si se trata de un partido amistoso, uno eliminatorio, la Copa de la Confederación local, o muchos más. (Los amistosos y la Copa Oro valen exactamente lo mismo, por cierto.) Este se llama coeficiente de competitividad y es el primer paso; también calcula ratings de Goles Esperados tanto a la defensiva como a la ofensiva, calcula ratings individuales de cada jugador -los clasifica según habilidades, liga en la que juegan, titularidad, etcétera. 

Hay una diferencia curiosa entre el Elo Rating y el SPI: un equipo puede perder puntos en SPI incluso si gana el juego, si su actuación está muy debajo de lo esperado. En particular, puesto que el SPI depende de goles esperados, las malas actuaciones -independientemente del resultado- pueden ir bajando las expectativas. De esta manera, el SPI puede ser más veloz en detectar cambios. 

Volver en el tiempo y apostarle al Leicester

Estoy convencido de que conocemos al menos una persona que viajó en el tiempo: el fan que apostó 5 libras al Leicester cuando pagaban 5000-1. Las casas de apuestas ponen esos odds para que la apuesta parezca tentadora, y lo es. Las pérdidas más altas fueron con 100-1, cuando Leicester ya parecía un contendiente serio y más gente parecía animarse ya no con 5 libras sino con mil. 


Si observas el histórico del ELO rating del Leicester, es sinceramente impresionante. Nigel Pearson agarró al equipo con apenas encima de 1500 puntos y se lo entregó a Claudio Ranieri debajo de los 1650 puntos. Al inicio de la temporada 2015/2016, prácticamente todos los comentaristas de The Guardian ponían a los Zorros como candidatos a descender: se habían salvado la temporada anterior con 7 victorias finales que parecían sumamente afortunadas

En una liga dominada por solo cuatro equipos, lo que hizo el Leicester es absolutamente impresionante, quizás la historia del underdog más grande que nos toque vivir a menos que los Cafés de Cleveland ganen el Super Bowl LII: Leicester jugó la temporada 2008/2009 en tercera división inglesa y apenas la temporada anterior 2014/2015 habían regresado a la Premier. 

En el proceso de investigar para esta entrada, aprendí las siguientes cosas, en caso de que todavía quieras apostar: 
  • Apuesta temprano. Los apostadores van corrigiendo los odds conforme se acerca el partido o está más avanzado el torneo; si apuestas temprano puedes cachar algún pequeño error que creas que hayan cometido. 
  • Los índices como Elo son lentos. La mayoría de las ligas hacen predicciones Elo basadas en el fin de la temporada anterior, que tardan en mostrar cambios; si todos empezaran con el mismo puntaje Elo, la temporada se ve más real después de un tiempo. En cualquier caso, los puntajes Elo, como casi cualquier otra predicción, son casi adivinanzas al inicio de una temporada. 
  • Los apostadores saben que no nos gusta apostar a los empates, que nos dejamos llevar por nuestra fanaticada, que nos gusta ver enormes odds a nuestro favor y apostar por el favorito. Es por eso que casi seguro las casas de apuestas no perdieron con la historia del Leicester: por cada persona que le apostó a favor, diez habrán querido sacar dinero fácil apostando que perdía (así funcionan los odds).
  • Los apostadores tienen modelos similares que les llevan a marcar sus odds, las probabilidades no siempre suman 100% pues están marcadas para que la casa siempre gane -la comisión, al menos-. No es fácil ganarle a la casa. 
  • Se llama suerte.  
Piensa en la victoria de 7-1 de Alemania sobre Brasil en el Mundial del 2014. Uno de los dos iba a ganar pero era prácticamente imposible prever el resultado. Algunos modelos y predicciones pueden considerar cosas que otros no ven, a veces la gente tiene suerte. Ciertamente, ningún modelo puede predecir lo impredecible. 





No hay comentarios.:

Publicar un comentario