Los parientes pobres

Intervalos de predicción.

intervalos de predicción

Se describen otros intervalos menos conocidos que el intervalo de confianza, tales como los intervalos de predicción y los intervalos de tolerancia.

Esto de los parientes pobres me recuerda un antiguo chiste de colegio sobre un marqués que tiene un sobrino de clase baja y con el que tiene que compartir mesa con toda la aristocracia con la que se codea el marqués. Éste, muy preocupado, le insiste muchas veces que tiene que ser muy educado con sus invitados. Así que, en mitad de la cena, el sobrino se levanta y anuncia: señoras y señores, excúsenme pero tengo que ir a hacer mis necesidades fisiológicas. El chico se levanta y comienza a caminar hacia el cuarto de baño. Pero a mitad de camino se detiene bruscamente, se queda pensando, se vuelve y exclama: ¡bueno, a lo mejor también cago!

Por fortuna, la familia no siempre te da problemas de este tipo, ni es frecuente que se mezclen las clases sociales y, desde luego, un marqués de la vida real tampoco invitaría a la misma mesa a un sobrino como este, aunque fuese de la familia.

Y hay familias muy bien avenidas, a pesar de que siempre alguno de sus miembros se lleve gran parte de la fama. Este es el caso de la familia de los intervalos. El más conocido por todos es nuestro intervalo de confianza, pero éste tiene dos primos mucho menos célebres pero que también contribuyen dignamente a la lucha contra la incertidumbre en la inferencia estadística: el intervalo de predicción y el intervalo de tolerancia.

Todos somos conscientes de la imposibilidad, la mayor parte de las veces, de acceder a toda la población cuando queremos conocer alguno de sus parámetros. Por este motivo se desarrollan técnicas de inferencia para tratar de estimar los valores inaccesibles de la población a partir de valores obtenidos de muestras de esa población.

El problema es que estas estimaciones tienen siempre una probabilidad de error. Y aquí es donde entra en juego nuestra familia de intervalos.

Intervalos de confianza

El primero es el intervalo de confianza que nos permite, una vez calculado el parámetro en la muestra, estimar entre qué límites se encuentra el valor real e inaccesible en la población, siempre con una probabilidad de error. Por convenio suele fijarse el nivel de confianza en el 95%, de tal forma que el intervalo se calcula según la siguiente expresión:

IC95% = parámetro ± 2 veces el error estándar del parámetro.

En el caso sencillo de cálculo del intervalo para la media  el error estándar es igual a la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra, pero con otros estadísticos esto puede complicarse un poco.

De todas formas, el intervalo de confianza siempre representará el margen que probablemente contiene el valor verdadero y desconocido en la población. La probabilidad de contención (la confianza) no se aplica al intervalo sino, en realidad, a la proporción de todos los intervalos que incluirían el parámetro real si repitiésemos la medida un número grande de veces.

Aunque los intervalos de confianza dan para hablar mucho rato, no nos vamos a entretener más por ahora. Para el que esté interesado, recomiendo un artículo de la Revista de Pediatría de Atención Primaria donde se trata todo esto con más detenimiento.

Intervalos de predicción

El segundo miembro de esta familia es el intervalo de predicción. El concepto de intervalo predictivo es muy similar al de intervalo de confianza. En este caso, una vez que hemos estimado el valor de la población a partir de una muestra, el intervalo predictivo nos dirá entre que límites estará una proporción de sujetos elegidos al azar de esa población, con un grado de probabilidad determinada.

Si la variable que estamos midiendo sigue una distribución normal (generalmente podemos aproximar a una normal si el tamaño de la muestra es grande), el valor del 95% de los sujetos estará entre la media ± dos veces la desviación típica. Bastante parecido al intervalo de confianza, pero con dos diferencias claras.

Primero, el predictivo utiliza la desviación estándar en lugar del error estándar del intervalo de confianza. Como la desviación típica es siempre mayor que el error estándar, los intervalos predictivos serán siempre más amplios que los de confianza para el mismo nivel de incertidumbre. Segundo, para calcular el intervalo de confianza tenemos que medir previamente el valor en una o varias muestras, mientras que el intervalo predictivo se calcula a priori, antes de extraer el sujeto o sujetos de la población.

Intervalos de tolerancia

El tercer primo en discordia es el intervalo de tolerancia. Este es muy similar al intervalo predictivo. Se elabora con una serie de datos de una o varias muestras y nos dice entre que límites se encontrarán las observaciones que hagamos en el futuro con el nivel de confianza o probabilidad que elijamos.

Al igual que el predictivo, el intervalo de tolerancia se hace después de hacer la estimación en la población. Su utilidad será conocer la proporción de todas las observaciones futuras que estarán dentro de unos márgenes determinados con una cierta probabilidad.

Como es lógico, todas estas muestras deben escogerse de la misma población, en las mismas condiciones y de forma aleatoria.

En teoría, el intervalo de tolerancia solo es válido si se calcula a partir de la media y desviación típicas reales de la población pero, como estos valores suelen ser desconocidos, se usan los promedios estimados, introduciendo así un grado de incertidumbre que será mayor cuanto menor sea el tamaño de la muestra.

Esta incertidumbre es la que controla el intervalo de tolerancia: nos dirá, con una confianza determinada, la proporción de la población que se encontrará dentro de unos límites dados. Para calcularlo se utiliza la siguiente expresión:

IT95% = parámetro ± k DS

Donde DS es la desviación estándar del parámetro y k es una función que tiene en consideración el tamaño de la muestra, el nivel de confianza y la proporción de la población que se mide. La matemática es compleja, así que no intentéis calcularlo sin ayuda de aplicaciones informáticas.

Para ir terminando, comentaros que, tanto el intervalo de predicción como el de tolerancia, pueden ser bilaterales o unilaterales. Los unilaterales nos dirán el valor mínimo o máximo que tendrán los valores de la población con el grado de confianza que especifiquemos.

Nos vamos…

Y esto es todo, amigos. No hemos dicho nada de otro intervalo predictivo mucho menos amigable, pero que tiene también gran utilidad. Y es que los intervalos predictivos tienen su papel en los modelos de regresión. Pero esa es otra historia…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información básica sobre protección de datos Ver más

  • Responsable: Manuel Molina Arias.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a Aleph que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos. Al hacer clic en el botón Aceptar, aceptas el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Antes de aceptar puedes ver Configurar cookies para realizar un consentimiento selectivo.    Más información
Privacidad