Decisiones salomónicas

Ji-cuadrado para bondad de ajuste.

ji-cuadrado para bondad de ajuste

La prueba de la ji-cuadrado para bondad de ajuste permite inferir si una muestra puede provenir de una población.

¡Cuánto no habría dado el rey Salomón por saber algo más sobre cálculo de probabilidades!. Y eso que ya era bastante sabio. Pero no cabe duda, si hubiese tenido unas mínimas nociones de estadística, sus decisiones habrían sido mucho más fáciles. Y, desde luego, casi seguro que no habría tenido que partir niños por la mitad. Claro que entonces no sería famoso. A los personajes históricos les pasa como a las fiestas populares: cuanto más salvaje, más gustan.

Y para demostraros de qué estoy hablando os voy a poner, como es habitual, un ejemplo tan estúpido que se os van a acabar las ganas de seguir leyendo.

Un suponer

Supongamos por un delirante momento que soy un vigilante de seguridad en una tienda de caramelos gigante. Me avisan porque han pillado a un niño con una bolsa de caramelos que, presuntamente, ha robado del barril gigante de caramelos de la tienda. El pobre crío dice que él no ha hecho nada malo y que los caramelos son de otra tienda pero, claro, ¿qué va a decir?. ¿Qué podemos hacer?. Ya sé… partir al niño por la mitad, como haría el rey Salomón.

Pero cualquiera se da cuenta en seguida que esa solución no es muy buena. ¿Quién sabe si el pobre es inocente, como él dice?. Así que vamos a pensar un poco cómo podemos averiguar si los caramelos de la bolsa son de nuestra tienda o de la otra que nos hace la competencia.

Ji-cuadrado para bondad de ajuste

Nos dice el encargado de nuestra tienda que en el barril el 25% de los caramelos son de naranja, el 20% de fresa, el 20% de menta, el 25% de café y el 10% de chocolate. Así que miramos en la bolsa del niño y vemos que tiene 100 caramelos de los siguientes sabores: 27 de naranja, 18 de fresa, 20 de menta, 22 de café y 13 de chocolate.

Si los caramelos procediesen de nuestro barril la proporción de los sabores sería la misma en el barril y en la bolsa ya que, a efectos prácticos, podríamos asumir que el ladrón metió la mano y sacó al azar 100 caramelos del barril (este método no nos vale si ha seleccionado los caramelos por su sabor).

Así que la pregunta es sencilla: ¿el reparto de los caramelos del niño es compatible con que los caramelos provengan de una muestra aleatoria de nuestros caramelos?. Las pequeñas diferencias se deberían al error de muestreo, así que planteamos nuestra hipótesis nula de que el niño nos ha robado los caramelos.

En primer lugar planteamos la distribución teórica que tendrían que tener los caramelos y la que tienen en realidad, siempre asumiendo que la hipótesis nula es cierta.

ji-cuadrado para bondad de ajuste A nosotros nos interesa saber si la diferencia entre el reparto teórico y el observado puede explicarse por el azar. Pero si sumamos las diferencias se anulan una con otras y el resultado final es cero. Como sabemos que esto siempre nos va a ocurrir, lo que hacemos es elevar las diferencias al cuadrado (para eliminar los negativos) antes de sumarlas. El problema es que no es lo mismo esperar 2 y obtener 7 que esperar 35 y obtener 40. Aunque en ambos ejemplos la diferencia sea de cinco, parece evidente que el margen de error es mayor en el primer ejemplo. Por eso estandarizamos la diferencia entre observado y esperado dividiéndola por el valor esperado. Y ahora sí, sumamos estos resultados para obtener un valor determinado, que en nuestro caso es de 1,08.

Y 1,08, ¿es mucho o es poco?. Pues depende, unas veces será mucho y otras poco. Lo que sí sabemos que es este valor sigue, aproximadamente, una distribución de probabilidad de ji-cuadrado con un número de grados de libertad igual al número de categorías (sabores en nuestro ejemplo) menos una.

Así que si buscamos la probabilidad de un valor de ji de 1,08 con 4 grados de libertad, para lo que podemos usar un programa informático, una tabla de probabilidades o una de las calculadoras disponibles en Internet. Obtenemos de esta forma una p = 0.89 (89%). Como es mayor del 5% no podemos rechazar la hipótesis nula, así que llegamos a la conclusión de que el niño es, además de ladrón, bastante mentiroso. Su bolsa de caramelos es representativa de una muestra aleatoria obtenida de nuestro barril.

Nos vamos…

Ya veis qué fácil es comprobar la procedencia de una muestra aplicando la prueba de la ji-cuadrado. Pero esta prueba no solo sirve para estudiar la procedencia de muestras aleatorias, sino que también puede utilizarse para comprobar si existe alguna relación de dependencia entre variables cualitativas. Pero esa es otra historia…

2 comentarios

  1. Si en nuestro estudio averiguamos incluimos la variable de la proporción de caramelos que hay en el barril de la tienda de la competencia, puede ser que nos encontremos con que es similar o muy parecida a la proporción de nuestro barril y por lo tanto nuestro niño sea totalmente inocente.

    • Entonces habría, además, otra posibilidad: que hubiese robado en la tienda de la competencia.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Manuel Molina Arias.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Aleph que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Antes de aceptar puedes ver Configurar cookies para realizar un consentimiento selectivo.    Más información
Privacidad