Todos hemos visto alguna vez algún sorteo en el que se escoge una letra aleatoriamente y los ganadores se seleccionan por orden alfabético, empezando por la primera persona cuyo apellido tenga esa letra como inicial. Todos nos hemos dado cuenta de que es un sistema injusto; por ejemplo, es un chollo llamarse Abad, porque probablemente conseguirás aquello que se sortee tanto si sale la W como si sale la X, Y, Z o la A.
La mayoría de nosotros, incluido yo, hemos pensado que la diferencia de probabilidades sería pequeña... bueno, pensar, lo que se dice pensar, no lo hemos pensado, simplemente lo hemos dado por supuesto.
Bueno, pues no, la diferencia no es pequeña. Yo me he dado cuenta después de que mi amigo Raúl Corvillo me llamase la atención sobre dos blogs, "Un dato vale más que mil palabras" y "La ciencia para todos". También está este artículo de una mujer cabreantemente apellidada Grima.
El problema es que las iniciales de los apellidos en España están distribuidas de una forma más caprichosa de lo que se podría esperar; estos datos están sacados del primer blog:
frecuencia
|
% sobre el total
|
|
A
|
2.884.390
|
6,7%
|
B
|
2.263.664
|
5,2%
|
C
|
3.969.992
|
9,2%
|
D
|
1.747.696
|
4,0%
|
E
|
781.910
|
1,8%
|
F
|
1.877.528
|
4,3%
|
G
|
4.857.351
|
11,2%
|
H
|
992.297
|
2,3%
|
I
|
424.730
|
1,0%
|
J
|
722.854
|
1,7%
|
K
|
55.885
|
0,1%
|
L
|
2.250.441
|
5,2%
|
M
|
5.291.515
|
12,2%
|
N
|
699.534
|
1,6%
|
O
|
803.973
|
1,9%
|
P
|
3.042.595
|
7,0%
|
Q
|
185.195
|
0,4%
|
R
|
3.565.620
|
8,2%
|
S
|
3.201.882
|
7,4%
|
T
|
1.425.424
|
3,3%
|
U
|
171.705
|
0,4%
|
V
|
1.631.083
|
3,8%
|
W
|
48.578
|
0,1%
|
X
|
14.690
|
0,0%
|
Y
|
92.553
|
0,2%
|
Z
|
269.539
|
0,6%
|
TOTAL
|
43.272.624
|
99,8%
|
Por si algún día le pasase algo al blog de Eduardo, también hago una copia de su histograma, que ilustra maravillosamente lo irregular que es la distribucion de las iniciales:
Para echar las cuentas, he escrito este programita: