Ciencia sin seso… locura doble

Píldoras sobre medicina basada en pruebas

Entradas etiquetadasMuestreo aleatorio
image_pdf

Decisiones salomónicas

¡Cuánto no habría dado el rey Salomón por saber algo más sobre cálculo de probabilidades!. Y eso que ya era bastante sabio. Pero no cabe duda, si hubiese tenido unas mínimas nociones de estadística, sus decisiones habrían sido mucho más fáciles. Y, desde luego, casi seguro que no habría tenido que partir niños por la mitad. Claro que entonces no sería famoso. A los personajes históricos les pasa como a las fiestas populares: cuanto más salvaje, más gustan.

Y para demostraros de qué estoy hablando os voy a poner, como es habitual, un ejemplo tan estúpido que se os van a acabar las ganas de seguir leyendo.

Supongamos por un delirante momento que soy un vigilante de seguridad en una tienda de caramelos gigante. Me avisan porque han pillado a un niño con una bolsa de caramelos que, presuntamente, ha robado del barril gigante de caramelos de la tienda. El pobre crío dice que él no ha hecho nada malo y que los caramelos son de otra tienda pero, claro, ¿qué va a decir?. ¿Qué podemos hacer?. Ya sé… partir al niño por la mitad, como haría el rey Salomón.

Pero cualquiera se da cuenta en seguida que esa solución no es muy buena. ¿Quién sabe si el pobre es inocente, como él dice?. Así que vamos a pensar un poco cómo podemos averiguar si los caramelos de la bolsa son de nuestra tienda o de la otra que nos hace la competencia.

Nos dice el encargado de nuestra tienda que en el barril el 25% de los caramelos son de naranja, el 20% de fresa, el 20% de menta, el 25% de café y el 10% de chocolate. Así que miramos en la bolsa del niño y vemos que tiene 100 caramelos de los siguientes sabores: 27 de naranja, 18 de fresa, 20 de menta, 22 de café y 13 de chocolate.

Si los caramelos procediesen de nuestro barril la proporción de los sabores sería la misma en el barril y en la bolsa ya que, a efectos prácticos, podríamos asumir que el ladrón metió la mano y sacó al azar 100 caramelos del barril (este método no nos vale si ha seleccionado los caramelos por su sabor).

Así que la pregunta es sencilla: ¿el reparto de los caramelos del niño es compatible con que los caramelos provengan de una muestra aleatoria de nuestros caramelos?. Las pequeñas diferencias se deberían al error de muestreo, así que planteamos nuestra hipótesis nula de que el niño nos ha robado los caramelos.

En primer lugar planteamos la distribución teórica que tendrían que tener los caramelos y la que tienen en realidad, siempre asumiendo que la hipótesis nula es cierta.

caramelos_chiA nosotros nos interesa saber si la diferencia entre el reparto teórico y el observado puede explicarse por el azar. Pero si sumamos las diferencias se anulan una con otras y el resultado final es cero. Como sabemos que esto siempre nos va a ocurrir, lo que hacemos es elevar las diferencias al cuadrado (para eliminar los negativos) antes de sumarlas. El problema es que no es lo mismo esperar 2 y obtener 7 que esperar 35 y obtener 40. Aunque en ambos ejemplos la diferencia sea de cinco, parece evidente que el margen de error es mayor en el primer ejemplo. Por eso estandarizamos la diferencia entre observado y esperado dividiéndola por el valor esperado. Y ahora sí, sumamos estos resultados para obtener un valor determinado, que en nuestro caso es de 1,08.

Y 1,08, ¿es mucho o es poco?. Pues depende, unas veces será mucho y otras poco. Lo que sí sabemos que es este valor sigue, aproximadamente, una distribución de probabilidad de chi-cuadrado con un número de grados de libertad igual al número de categorías (sabores en nuestro ejemplo) menos una.

Así que si buscamos la probabilidad de un valor de chi de 1,08 con 4 grados de libertad, para lo que podemos usar un programa informático, una tabla de probabilidades o una de las calculadoras disponibles en Internet. Obtenemos de esta forma una p = 0.89 (89%). Como es mayor del 5% no podemos rechazar la hipótesis nula, así que llegamos a la conclusión de que el niño es, además de ladrón, bastante mentiroso. Su bolsa de caramelos es representativa de una muestra aleatoria obtenida de nuestro barril.

Ya veis qué fácil es comprobar la procedencia de una muestra aplicando la prueba de la chi-cuadrado. Pero esta prueba no solo sirve para estudiar la procedencia de muestras aleatorias, sino que también puede utilizarse para comprobar si existe alguna relación de dependencia entre variables cualitativas. Pero esa es otra historia…