Tabla de contenidos
Tamaño muestral.
Se realizan una serie de consideraciones sobre la influencia del tamaño de la muestra sobre la precisión y la probabilidad de error del estudio.
Hablamos de muestras, claro…
Por razones diversas, los estudios científicos suelen utilizar muestras extraídas de una población sobre la que se quiere obtener una conclusión determinada. Esta muestra tendrá que haber sido seleccionada de forma que represente fielmente a la población de la que procede pero, ¿conviene que sea grande o pequeña?. Pues ni una cosa ni otra: la muestra debe ser del tamaño apropiado.
Después de razonar hasta llegar hasta esta conclusión necesitaría reposar un poco, pero antes trataremos de ver los problemas que nos pueden causar las muestras demasiado grandes o demasiado pequeñas.
Tamaño muestral
Los inconvenientes de las muestras más grandes de lo necesario son obvios: mayor gasto de tiempo y recursos. Pero es que, además, como sabemos que muchas veces para obtener significación estadística basta con aumentar el tamaño de la muestra, si lo hacemos en exceso podemos obtenerla con diferencias tan pequeñas que, aunque puedan ser reales, carezcan del menor interés desde el punto de vista clínico. De esta forma malgastamos tiempo y energías (y dinero) y podemos inducir a error sobre la importancia de la diferencia encontrada. Así que, como en otros muchos aspectos de la vida y de la medicina, al hablar de muestras no siempre más es mejor (ni es mejor tenerla más grande).
¿Qué pasa si la muestra es pequeña? Pues pasa un poco lo contrario. Cuánto más pequeña sea la muestra más imprecisióntendremos en los resultados (los intervalos de confianza de los parámetros estudiados serán más amplios). De esta manera, las diferencias tendrán que ser mayores para poder alcanzar significación estadística. Corremos así el riesgo de que, aunque exista una diferencia real, no podamos asegurar su existencia por ser la muestra demasiado pequeña, perdiendo la ocasión de demostrar diferencias que, aunque pequeñas, pueden ser clínicamente muy importantes.
Queda claro, pues, que la muestra tiene que ser del tamaño apropiado y que, para evitar males mayores, debemos calcularla antes de realizar el estudio.
Las fórmulas para calcular el tamaño de la muestra dependen del estadístico que estemos midiendo y de si estimamos uno en la población (una media, por ejemplo) o queremos hacer un contraste de hipótesis entre dos variables o muestras (comparar dos muestras, dos proporciones, etc). En cualquier caso, la mayoría de los programas de estadística y calculadoras de Internet son capaces de calcularla de forma rápida y sin protestar. Nosotros solo tendremos que decidir tres parámetros: el error de tipo 1, la potencia del estudio y la mínima diferencia clínicamente importante.
El error de tipo I es la probabilidad de rechazar la hipótesis nula siendo cierta, concluyendo que existe una diferencia que, en realidad, no es real. Se suele aceptar que esta probabilidad, llamada alfa, debe ser menor del 5% y no es más que el nivel de significación estadística empleado en el contraste de hipótesis.
El error de tipo II es la probabilidad de concluir que no hay diferencia (no rechazamos la hipótesis nula) cuando en realidad sí que la hay. Este valor se conoce como beta y se admite como bueno un mínimo de 80%. Su complementario (1-beta o 100-beta si preferimos los %) es lo que se conoce como potencia del estudio.
Por último, la mínima diferencia clínicamente importante es la que debe ser capaz de detectar el estudio, en el caso de que exista realmente. Este es un valor que decide el investigador según el contexto clínico y que no tiene nada que ver con la significación estadística del estudio.
Con estos tres parámetros calcularemos el tamaño de la muestra necesario para detectar la diferencia que creamos importante desde el punto de vista clínico y con el margen de error deseado.
En ocasiones el razonamiento puede hacerse al revés. Si la muestra tiene un tamaño máximo por la razón que sea, podemos estimar antes del estudio qué diferencia vamos a poder detectar. Si esta diferencia es inferior a la clínicamente importante, podemos ahorrarnos el trabajo, ya que correremos el riesgo de que no sea concluyente por tener una muestra pequeña e inducir a error dando a entender que la diferencia no existe. Del mismo modo, si nos vemos obligados a interrumpir el estudio antes de su finalización programada deberemos calcular si con la muestra alcanzada tenemos capacidad para discriminar la diferencia que nos habíamos propuesto inicialmente.
Según la variable que estemos midiendo, en ocasiones necesitaremos otros datos como su media o su desviación estándar en la población para poder estimar el tamaño de muestra necesario. Si no los conocemos, podemos hacer un estudio piloto con unos pocos pacientes (a criterio del investigador) y calcular el tamaño de la muestra con los resultados preliminares.
Nos vamos…
Una última reflexión antes de irnos a poner la cabeza en remojo. El tamaño muestral se calcula para estimar la variable principal de resultado, pero esto no garantiza que tengamos la muestra adecuada para todo lo que midamos en el estudio. Esto produce, con relativa frecuencia, que trabajos que demuestran muy bien la eficacia de un tratamiento fracasen en dar datos concluyentes sobre la seguridad del mismo, pero esa es otra historia…
[…] de la muestra en el diseño de un estudio, os sugiero que leais el post de Manuel Molina “El tamaño sí importa” en su blog “Ciencia sin seso… locura […]
¿qué se entiende por una muestra pequeña o muy pequeña? ¿cuándo no debe usarse los porcentajes? n < 10, n < 30, n < 100 ?
Gracias Eduardo por tu pregunta y por seguir el blog.
En realidad, una muestra no es ni grande ni pequeña, sino adecuada o no para lo que necesitamos.
Si queremos calcular un intervalo de confianza de una estimación, calcularemos el tamaño muestral necesario para que el intervalo tenga la amplitud deseada y el nivel de confianza que queramos. Si hacemos un ensayo, calcularemos antes el tamaño clínica que consideremos importante y el tamaño de muestra que necesitamos para que, en el caso de detectar esa diferencia, sea estadísticamente significativa.
Para un tamaño de efecto grande necesitaremos una muestra más pequeña que para un tamaño de efecto pequeño.
No entiendo tu pregunta sobre los porcentajes. Siempre pueden usarse. Lógicamente, si hacemos una estimación del porcentaje obtenido en una muestra, cuanto más pequeña sea la muestra, más amplio será el intervalo de confianza y, por tanto, menos precisa la estimación.
Espero haberte aclarado.
Saludos
Manolo Molina
Hola. Estoy haciendo un estudio en donde trabajo con dos poblaciones de tamaños diferentes a comparar, una de poco más de 14,000 y la otra de poco más de 4,000. Al momento de sacar muestras de ambas éstas quedan muy similares (entre 385 a 365), pero me preguntó si hay algún tipo de regla que deba aplicar o no, con el propósito de justificar que las muestras son adecuadas independientemente de que se obtuvieron de poblaciones diferentes?
Hola Salvador. Muchas gracias por tu pregunta.
Que yo sepa, no hay problema en comparar dos muestras que provengan de poblaciones de tamaño diferente, siempre que sean extraidas de forma aleatoria y que sean representativas de la población de la que proceden.
El tamaño de cada una de las muestras dependerá del tamaño de efecto que quieras detectar, del nivel de significación y de la dispersión de la variable que estés estudiando. Como normal general, el tamaño de la muestra no depende del tamaño de la población, aunque si la muestra es grande respecto al tamaño poblacional, puede ser conveniente que realices la corrección para población finita.
Un método sencillo consiste en multiplicar el tamaño calculado (n) por el resultado del cociente N/(N-n), donde N es el tamaño de la población.
Para tu muestra de 365 que proviene de una población de 4000, el tamaño corregido sería de 365 x (4000/4000-365)) = 401. Para la otra población, más grande, no merece la pena hacer el ajuste, pero te saldrían 395. Cuanto mayor sea la población respecto a la muestra, menos diferencia entre el tamaño muestral estimado y el ajuste para población finita.
Espero haberte ayudad.
Saludos
Manolo