sábado, 2 de marzo de 2019

¿Cuánto cuesta encontrar el número más probable en una ruleta?

Alguien me ha preguntado recientemente si teniendo los números que han salido en 6.000 partidas de ruleta se podría averiguar a qué número habría que apostar. La pregunta me ha intrigado...

Es sorprendente, pero 6.000 partidas no son muchas. "Muchas", "pocas" o "suficientes" dependerá de cuánto se aparten las probabilidades de 1/37. He googleado un poco, pero no he encontrado ningún sitio donde hablen de esto; los fabricantes afirman que sus ruletas están maravillosamente equilibradas y que usan la teoría del caos para diseñarlas de forma que sean impredecibles, pero por ninguna parte se menciona nada parecido a una tolerancia.

Admito mi ignorancia pero, como estoy intrigado, no me rindo, así que me voy a inventar una tolerancia.

Lo ideal sería que todos los números tuviesen una probabilidad de 1/37; de esta forma, apuestes al número al que apuestes, esperas perder 1/37 de tu apuesta, porque ganas 35 con probabilidad 1/37, pierdes 1 con probabilidad 36/37, y 35*1/37-1*36/37 = -1/37.

Si las probabilidades reales de un número se desvían menos de un 1%, no pasará gran cosa, el casino seguirá ganando bastante.

El casino empezaría a tener problemas si alguno de los números llegase a tener probabilidad 1/36 (que está un 2.7% por encima de 1/37). Si esto ocurre, es posible "jugar gratis" apostando a ese número, porque 35*1/36-1*(1-1/36)=0; es decir, ni se gana ni se pierde. Quizás el casino podría tolerar que un jugador hiciera esto mientras no se lo contase a los demás, o a lo mejor el casino no se daría cuenta porque le sería difícil detectarlo (lo veremos a continuación).

Lo que sí que no creo que ningún casino pueda tolerar es que un número de la ruleta llegue a tener una probabilidad de 38/(36*37), un 5.5% por encima de 1/37, porque en ese momento el jugador que conozca esto jugará con tanta ventaja sobre el casino como la que el casino tiene normalmente sobre los jugadores; 35*38/(36*37)-1*(1-38/(36*37))=1/37. Así que se ganaría un 1/37 de lo apostado, que es lo que normalmente hace el casino. No sólo sería intolerable, es que además me imagino que se notaría mucho si se hiciese mucho tiempo. Aquí "intolerable" no quiere decir nada mafioso: el casino cambiaría la ruleta y dejaría que el jugador siguiese jugando para que perdiese lo ganado anteriormente.

Así que me he inventado el criterio de que las ruletas en un casino legal (las cosas serán diferentes en timbas en furgonetas) pueden llegar a tener, como mucho, una probabilidad de que salga un número de 75/2664, que está a mitad de camino entre 1/36 y 38/(36*37).

Vale, quizás esto es un disparate; de hecho, yo apostaría a que será muy poco probable que en un casino con ruletas modernas haya algún número con probabilidad de salir por encima de 1/36. Pero bueno, imaginemos que precisamente queremos encontrar una ruleta que está estropeada. El caso es que ya tengo un límite con el que echar cuentas.

El problema entonces es el siguiente. Tenemos una ruleta en la que un número (no sabemos cuál) sale con probabilidad 75/2664, y todos los demás números salen con probabilidad 2589/95904. Tengo los resultados de 6.000 partidas. ¿Puedo decir que el número buscado es simplemente el número que aparece más veces en mi lista de 6.000 resultados?

Sorpresa: no; he simulado esto 100.000 veces, y sólo se acierta en el 8.4% de las ocasiones.

Esto puede parecer sorprendente, pero en realidad está claro por qué ocurre. En promedio, la diferencia entre que un número salga en el 1/37 o en el 75/2664 de 6.000 partidas es 162 y 169; pero la desviación típica del número de veces que sale es aproximadamente 12; así que la diferencia que buscamos (7) es menor que la variación de nuestro número debida al azar. Pero es que en realidad vamos a mirar al máximo del número de veces que han los 37 números; que tiene media 190 y desviación típica 6.1. Es decir, que lo normal es que alguno de los 36 números con probabilidad pequeña tenga suerte y salga 21 veces más que el que en principio debería ser el favorito.

Vale, con 6.000 partidas acertamos el 8.4% de las veces.

Pero con 20.000 partidas acertamos el 16% de las veces.

Y con 200.000 partidas acertamos el 82.6% de las veces.

Se me ha ocurrido otro "juego". Volvamos a una ruleta con un número que sale con probabilidad 75/2664. Primero observo sin jugar 6.000 partidas, y entonces empiezo a jugar, pero sigo contando cuántas veces sale cada número, y siempre apuesto al que ha salido con más frecuencia. En algún momento acertaré con el número correcto y empezaré a ganar sistemáticamente, porque mi ordenador va a jugar millones de partidas. La cuestión es, ¿cuál es la última partida en la que voy perdiendo? Para esto no me basta con simplemente encontrar el número correcto, sino que también tengo que recuperarme de las malas rachas que podría haber tenido al principio.

Los resultados son francamente decepcionantes. He simulado este juego 100.000 veces. En 39 ocasiones ha empezado a ganar desde el principio; lo normal es que se llegue a estar perdiendo unas 200.000 partidas; y en el 2,6% de las simulaciones hubo que jugar más de un millón de partidas antes de quedarse permanentemente en verde. Aquí están los resultados:

Intervalon
6000-600039
6001-65004067
6501-70002091
7001-80001980
8001-100002993
10001-200009320
20001-5000015778
50001-10000014678
100001-20000015099
200001-50000020520
500001-100000010781
1000001-inf2654

Todo esto no encaja muy bien con las historias que todos conocemos de gente que ha hecho saltar la banca. En España son famosos los Pelayo, pero hay muchos héroes parecidos en otros países. Se me ocurren tres explicaciones:

  1. Quizás cuando nos cuentan estas historias no enfatizan lo suficiente cuantísimas noches se pasaron apuntando números. O a lo mejor somos nosotros los que no escuchamos eso.
  2. Podría ser que las ruletas sean mucho menos imparciales de lo que yo me he inventado. Imaginemos que la probabilidad de que salga un cierto número en una ruleta fuese el 4% en vez del 2.7% normal; entonces, con los datos de 6.000 partidas pasadas acertaríamos el 99.9% de las veces. Quizás el truco no está en trabajar mucho buscando el mejor número en una ruleta normal, sino en encontrar rápido una ruleta desastrosa. Lo que pasa es que me cuesta creer que el casino no se dé cuenta de que tiene una ruleta estropeada; vamos, cuando yo he estado en un casino, los números que salen en las ruletas van apareciendo en una pantalla, así que me imagino que algún ordenador debe de ir comprobando que los números que salen son normales. Quizás parte del truco está en buscar casinos negligentes en vez de limitarse a buscar ruletas defectuosas.
  3. He estado pensando en el caso de que sólo un número sea más probable que los demás, pero a lo mejor es más fácil detectar si el eje de la ruleta está desviado; entonces la mitad de los números será un poco más probable que la otra mitad, y esto debería ser bastante más fácil de detectar estadísticamente que un número solo. (Por cierto, no importa mucho que la mesa de la ruleta esté inclinada si la ruleta está bien equilibrada; si, es verdad que las bolas acabarán con más frecuencia en la parte baja de la mesa, pero el número que habrá ahí irá cambiando.)

Aquí dejo el programa usado, en C++.

Nota añadida: me confirman que los Pelayo detectaban una mitad de la ruleta en la que la bola tenía más probabilidades de acabar, como si tuviese el eje torcido. Esto tiene mucho más sentido que buscar un número ligeramente mejor que el resto.