entre paralelas: Prisioneros y sus dilemas

Juntados y desjuntados

Aunque ya compartimos una entrada sobre Teoría de Juegos --sobre un par de cosas que más o menos aprendí en clase de Paco Sánchez, en el CIMAT--, no hemos hecho realmente una introducción decente, hablado de su historia, de los problemas que resuelve, de su relevancia. Lo que quizás la mayoría de las personas sepan de la Teoría de Juegos se refiere a lo que recuerdan de Una Mente Brillante, película de 2001 dirigida por Ron Howard y protagonizada por Russell Crowe. La película está basada en la vida de John Forbes Nash Jr., uno de los fundadores de la Teoría de Juegos, quien hizo aportaciones fundamentales. (Tristemente, Nash y su esposa fallecieron en un accidente de tránsito este mismo año.)

En una de las escenas más memorables de la película, Nash tiene una súbita epifanía en una charla de bar, sobre la manera óptima de ligar chicas. Empieza diciendo que Adam Smith --llamado padre de la economía moderna-- se equivocaba al afirmar que la ambición individual sirve al bien común. Así, suponiendo que todos van tras la chica rubia, todos se cancelarían entre ellos y, al final, tampoco tendrían éxito con sus amigas; luego, la estrategia óptima sería ir desde el principio por una de las amigas y no ir por la rubia. (En esta entrada de blog, Bernardo García se tomó muy en serio la necesidad de mostrar que esa no es realmente la estrategia que genera un equilibrio de Nash.)

Básicamente eso es lo que entendemos por un juego: una situación entre varias personas --o jugadores-- donde es necesario tomar una decisión que tiene varias consecuencias --a veces llamadas pagos-- que se pueden ver como beneficios o pérdidas. Luego, la Teoría de Juegos estudia dichas situaciones, las decisiones esperadas --o estrategias-- y, sobre todo, las decisiones que llevarían a una solución óptima --o equilibrio--. En general decimos que el equilibrio se alcanza si no es posible que un jugador cambie de estrategia para obtener más beneficios sin perjudicar a los demás. Existen distintos equilibrios: el equilibrio de Nash, la optimalidad de Pareto, el valor de Shapley, por nombrar algunos.

Decimos que un juego tiene suma cero si, para cualquier posible resultado, la suma de beneficios es siempre la misma. Por ejemplo, hace algunos años el fútbol era un juego de suma cero pues un partido ganado daba 2 puntos, perdido daba 0 puntos, y el empate repartía 1 y 1; dejó de ser un juego de suma cero para incentivar a los equipos a buscar la victoria --y ahora el ganador recibe 3 puntos--.

fútbol espectáculo

Además, es posible representar un juego con una matriz de pagos, es decir, una tabla --matriz-- que indique los beneficios potenciales --o perjuicios, si fuera el caso-- que cada jugador obtendría en cada escenario posible. Vamos a usar esta representación para hablar de uno de los juegos clásicos: el Dilema del Prisionero. En este juego, dos personas serán sentenciadas; individualmente, el juez le dice a cada uno que pueden decidir confesar y acusar al otro: si ambos acusan, reciben 6 años cada uno; si solo uno acusa, esa persona sale libre y la otra recibe 10 años; si ninguno decide confesar, ambos reciben únicamente un año. La matriz se fue así, con dibujitos y las condenas ligeramente cambiadas:

¿Qué harías tú?

Podemos ver que este juego no es de suma cero, pues los resultados varían demasiado en cada escenario. Además, el mejor resultado individual se da si traicionas a tu compañero siempre y cuando él no te traicione a ti también. Sin embargo, el mejor resultado para ambos se da cuando deciden colaborar. Es decir, ir detrás del beneficio personal podría conducir al perjuicio común. Sin embargo, sabiendo que el otro --o todos los demás-- decidirán cooperar, el beneficio personal --y, por lo tanto, la tentación-- crecen si se decide traicionar.

Se puede usar el dilema del prisionero para ilustrar una carrera armamentista: si en un periodo tenso ninguno de dos países está seguro que el otro vaya a acatar un acuerdo para no generar más armas, la decisión que tomará probablemente sea seguir haciéndose de armas. También se puede usar para hablar de una carrera ciclista con un pequeño grupo líder alejado del pelotón: si cooperan --y se turnan la punta donde hay que pelear contra el viento-- ninguno llegará más cansado que los demás para la recta final; si no cooperan, es posible que todos se cansen y eventualmente el pelotón los alcance; si solo uno coopera, sin duda terminará perdiendo la carrera.

Hay muchas variaciones del dilema del prisionero. La estrategia puede cambiar seriamente si convertimos el juego en uno de suma cero. En el programa de concursos norteamericano Friend or Foe (Amigo o Enemigo) la manera en que el equipo ganador se repartiría las ganancias es tal juego:

A coopera, B coopera: cada uno recibe la mitad
A coopera, B traiciona: B recibe todo
A traiciona, B coopera: A recibe todo
A traiciona, B traiciona: ninguno recibe nada

Otra de las diferencias con el dilema del prisionero es que los jugadores pueden ponerse de acuerdo antes de tomar la decisión, que puede hacer que traicionar sea mucho más interesante. Es decir, si ambos se saben sinceros el juego es bastante aburrido y predecible pues cooperar es la estrategia óptima. Sin embargo, si se sabe que el otro cooperará entonces traicionar es mucho más tentador. Una estrategia óptima, entonces, es obligar la cooperación: el jugador A anuncia que no cooperará pero promete que, si el otro decide cooperar, entonces repartirá la mitad; de esta manera, el jugador B --si quiere algo de dinero-- no tiene otra opción más que cooperar pues traicionar elimina toda posibilidad de ganar el juego para ambos.

Así, las decisiones que llevan al equilibrio pueden parecer contraintuitivas en muchas ocasiones, pero a veces esto es sencillamente porque no estamos acostumbrados a cooperar. Con todo esto, habría que darle la razón al John Nash de la película: Adam Smith se equivocó.

Para trabajar en casa:

Este semestre llevo Ecuaciones Diferenciales Parciales con Dr. Flavio Vigueras --que explica por qué vamos a hablar de peces, tiburones y Volterra en una próxima entrada-- y nos planteó el siguiente problema:

En una ciudad A existen 90 vehículos que trabajan en una ciudad B y todas las mañanas hacen el recorrido de A a B para el que existen dos rutas con dos ciudades intermedias C y D: de A a C se hacen 100 minutos --fijos-- y de C a B se hacen N1 minutos, donde N1 es la cantidad de coches que circulan sobre dicha ruta; similarmente, de A a D se hacen N2 minutos y de D a B se hacen 100 minutos --fijos--. Además, existe un camino que va de C a D y en el que se hacen siempre 2 minutos --fijos--.

Tal vez este dibujo pueda ilustrar el problema:

Dijimos "Tal vez..."

Piensa un momento: si fueras uno de dichos vehículos, ¿qué camino tomarías?

Sigue pensando.

Probablemente decides tomar el camino AD-DC-CB en el que, en el peor de los casos haces 182 minutos. Ese tiempo está asegurado y mejora si algún pobre inocente decide tomar alguno de los caminos más lentos. Sin embargo, como es el mejor camino, probablemente todos decidan tomarlo cada mañana, habría que prepararse para hacer 182 minutos cada día. (Por supuesto, los tiempos son solo ilustrativos.)

Lo que queremos poner en disputa, de nuevo, es la idea de no cooperar. Creemos que la solución óptima es la que arroja el mayor beneficio personal; luego, si todos toman esa decisión, se tiene el mayor beneficio común.

Ahora, imagina que eres la autoridad de tránsito --o el gobierno municipal o estatal, para el caso--. Hay una decisión que puedes hacer que mejoraría los tiempos para todos. ¿Cuál es esa decisión? Déjala en los comentarios. Te recordamos lo que sucedió en Friend or Foe: si la mejor solución es cooperar, a veces hay que obligar a cooperar.

Referencias y lecturas:

Mencionamos una entrada anterior sobre Teoría de Juegos que puedes leer acá. Se trata de dos articulitos sobre temas tratados en clase de Teoría de Juegos con Paco Sánchez, en CIMAT.

Además de esos dos artículos, en mi blog personal hay notas del curso y lecturas que Paco nos proveyó. Las puedes encontrar acá, en la sección de mi blog que tenía cuando intenté ser un alumno responsable. (Hay que bajar hasta séptimo semestre.) Además de artículos y referencias, puedes descargar algunas de las tareas del curso por si te sobra algo de tiempo.

Paco Sánchez es uno de los referentes en México sobre Teoría de Juegos y escribió un libro llamado Introducción a la Matemática de los Juegos que publicó Siglo XXI Editores. Además, te recomendamos este articulito llamado Aprendizaje en Teoría de Juegos que fue publicado en varias revistas.

Finalmente, un artículo sobre por qué la gente parece cooperar más de lo que se espera de ellos en el juego Friend or Foe, que habla de ciertos pagos emocionales.

entre paralelas

miércoles, 26 de agosto de 2015

Prisioneros y sus dilemas

No hay comentarios.:

Publicar un comentario