Ciencia sin seso… locura doble

Píldoras sobre medicina basada en pruebas

Entradas etiquetadasEstudios transversales
image_pdf

La tabla

Existen gran cantidad de tablas. Y tienen un gran papel a lo largo de nuestra vida. Quizás la que primero nos asalta en nuestra más tierna infancia es la tabla de multiplicar. ¿Quién no recuerda con nostalgia, al menos los más mayorcitos, como  repetíamos como loros aquello del dos por uno es dos, dos por… hasta que lo aprendíamos de memoria?. Pero no hicimos más que dominar las múltiples tablas de multiplicar cuando nos topamos con la tabla periódica de los elementos. Otra vez a aprender de memoria, esta vez ayudados de reglas nemotécnicas imposiblemente idiotas sobre Indios que Ganaban Buena Altura y no sé qué.

Pero es con los años cuando llega una de las peores de todas: la tabla de composición de alimentos, con su celda llena de calorías. Esta tabla nos persigue hasta en sueños. Y todo porque comer mucho tiene gran número de inconvenientes, demostrados la mayor parte de ellos gracias a la ayuda de otro tipo de tabla: la tabla de contingencia.

Las tablas de contingencia son usadas muy frecuentemente en Epidemiología para analizar la relación entre dos o más variables. Están formadas por filas y columnas. En las filas se suelen colocar los grupos por nivel de exposición al factor de estudio y en las columnas las diferentes categorías que tienen que ver con el estado de enfermedad o daño que investigamos. Filas y columnas se cruzan para formar celdas donde se representa la frecuencia de esa determinada combinación de variables.

Lo más habitual es que se representen dos variables (nuestra querida tabla 2×2), una dependiente y otra independiente, pero esto no siempre es así. Puede haber más de dos variables y, en ocasiones, puede no existir una dirección de dependencia entre las variables antes de realizar el análisis.

Las tablas 2×2 simples permiten analizar la relación entre dos variables dicotómicas. Según su contenido y el diseño del estudio al que pertenezcan, sus celdas pueden tener significados ligeramente diferentes, lo mismo que ocurre con las medidas que podemos calcular a partir de los datos de la tabla.

contingencia_transversalLas primeras serían las tablas de estudios transversales. En este tipo de estudios se representa una especie de foto fija de nuestra muestra que nos permite estudiar la relación entre las variables. Son, pues, estudios de prevalencia y, aunque los datos se recojan a lo largo de un periodo de tiempo, los resultados representan esa foto fija a la que ya nos hemos referido. En las columnas se coloca la variable dependiente (enfermedad o daño producido) y en las filas la independiente (el grado de exposición), con lo que podemos calcular una serie de medidas de frecuencia, de asociación y de significación estadística.

Las medidas de frecuencia son la prevalencia de enfermedad entre expuestos (EXP) y no expuestos (NEXP) y la prevalencia de exposición entre enfermos (ENF) y no enfermos (NENF). Estas prevalencias representan el número de personas enfermas, sanas, expuestas y no expuestas en relación con el total de cada grupo, por lo que son tasas estimadas en un momento puntual.

Las medidas de asociación son las razones de las prevalencias que acabamos de mencionar según enfermedad y exposición y la odds ratio, que nos dice cuánto más probable es que se produzca la enfermedad respecto a que no se produzca en EXP frente a NEXP. Un valor de estas medidas mayor de uno indica que el factor es de riesgo para que se produzca la enfermedad. Si vale de cero a uno querrá decir que el factor es de protección. Y si vale uno, pues que ni carne ni pescado.

Por último, como en todos los tipos de tablas que vamos a mencionar, se pueden calcular medidas de asociación estadística, fundamentalmente la chi-cuadrado con o sin corrección, la prueba exacta de Fisher y el valor de la p, uni o bilateral.

Muy parecidas a estas que hemos visto son las tablas de los estudios de casos y controles. En estos se trata de ver si diferentes grados de la exposición explican diferentes grados de enfermedad. En la columnas se colocan los casos y los controles y en las filas los EXP y NEXP.

contingencia_casos_controlesLas medidas de frecuencia que podemos calcular son la proporción de casos expuestos (respecto al total de casos) y la proporción de controles expuestos (respecto al total de controles). Lógicamente, podemos calcular también las proporciones de NEXP calculando los complementarios de los anteriores.

La medida de asociación fundamental es la odds ratio, que ya conocemos y en la que no nos vamos a detener mucho. Ya sabéis que, de forma simplificada, podemos calcularla como el cociente de los productos cruzados de la tabla y que nos indica cuánto es más probable contraer la enfermedad en EXP que en NEXP. La otra medida sería la fracción atribuible en los expuestos (FAExp), que nos indica el número de enfermos que son debidos a la acción directa de la exposición.

Podemos, en este tipo de tablas, calcular, además, una medida de impacto: la fracción atribuible en la población (FAPob), que sería el impacto potencial que tendría sobre la población el eliminar el factor de exposición. Si es un factor de riesgo sería un impacto positivo y, a la inversa, si es protector, negativo.

Comentar que las medidas de significación estadística dependerán de que los datos sean pareados (utilizaremos la prueba de McNemar) o no pareados (chi-cuadrado, prueba exacta de Fisher y valor de p).

contingencia_cohortes_acumulada

El tercer tipo de tablas de contingencia es el que corresponde a los estudios de cohortes, aunque la estructura difiere un poco si son estudios de casos nuevos producidos durante todo el periodo de estudio (incidencia acumulada) o si consideran el periodo de tiempo del estudio, el momento de aparición de la enfermedad y el diferente seguimiento de los grupos (tasa de incidencia o densidad de incidencia).

Las tablas de los estudios de incidencia acumulada (IA) son similares a las que hemos visto hasta ahora. En las columnas se representa el estado de enfermedad y en las filas el de exposición. Por otra parte, las de densidad o tasa de incidencia (TI) representan en una de las columnas el número de enfermos y en la otra el seguimiento en personas-año, de forma que los que tienen un seguimiento más prolongado tienen un mayor peso a la hora de calcular las medidas de frecuencia, asociación, etc.

contingencia_cohortes_densidadLas medidas de frecuencia serían los riesgos en EXP (Re) y en NEXP (Ro) para los casos de IA y las tasas de incidencia en EXP (TIe) y NEXP (TIo) en los de TI.

Los cocientes de las medidas anteriores nos permiten calcular las medidas de asociación: riesgos relativos (RR), reducción absoluta de riesgo (RAR) y reducción relativa de riesgo (RRR) para los estudios de IA y reducciones absolutas y relativas de las TI para los estudios de densidad. Podemos calcular también la FAExp como hacíamos con los estudios de casos y controles, al igual que la FAPob como medida de impacto.

En teoría pueden calcularse también las odds ratios, pero suelen ser menos utilizadas en este tipo de tablas. En cualquier caso, ya sabemos que odds ratio y RR se parecerán cuando la prevalencia de la enfermedad sea baja.

Para terminar con este tipo de tablas, podemos calcular las medidas de asociación estadística: chi-cuadrado, Fisher y p para estudios de IA y otras pruebas de asociación para los estudios de densidad de incidencia.

Como siempre, todos estos cálculos pueden realizarse a mano, aunque os recomiendo utilizar calculadoras, como la disponible en la Red CASPe. Es más sencillo, más rápido y, además, nos proporcionan todos estos parámetros con sus correspondientes intervalos de confianza, con lo que podemos estimar también su precisión.

Y con esto hemos llegado al final. Existen más tipos de tablas, con múltiples niveles por tratar más de dos variables, estratificadas según diferentes factores, etc. Pero esa es otra historia…

No es lo que parece

Espero, por vuestro bien, que nunca os hayáis tenido que ver en la situación de pronunciar esta frase. Y espero, también por vuestro bien, que si habéis tenido que pronunciarla en alguna ocasión no se viese precedida por la palabra “cariño”. ¿O sí?. Dejémoslo a la conciencia de cada cual.

Lo que sí es cierto es que esta frase debemos planteárnosla en forma de pregunta en una situación mucho menos escabrosa: al contemplar los resultados de un estudio transversal. Obvia decir, claro está, que, en estos casos, el cariño no es imprescindible.

Los estudios descriptivos transversales son un tipo de estudio observacional en los que se extrae una muestra representativa de la población que queremos estudiar y se mide la frecuencia de la enfermedad o el efecto que nos interese en los individuos de la muestra. Cuando medimos más de una variable, estos estudios se denominan de asociación cruzada, ya que nos permiten averiguar si las variables medidas guardan algún tipo de asociación.

Pero estos estudios tienen dos características que debemos tener siempre en cuenta. Primero, son estudios de prevalencia que miden la frecuencia en un momento concreto, por lo que el resultado puede variar en función del momento elegido para medir la variable. Segundo, como la medición se realiza de forma simultánea, resulta difícil establecer una relación causa-efecto, algo que a todos nos encanta hacer. Pero es algo que debemos evitar hacer porque, con este tipo de estudios, las cosas no son siempre lo que parecen. O, mejor dicho, las cosas pueden ser bastantes más cosas de lo que parecen.

¿De qué hablamos?. Veamos un ejemplo. Estoy un poco aburrido de ir al gimnasio, porque me canso cada vez más y mi estado físico… bueno, dejémoslo simplemente en que me canso, así que quiero estudiar si realmente el esfuerzo puede recompensarme con un mejor control de mi transversalpeso corporal. De esta manera, hago una encuesta y obtengo los datos de 1477 individuos de mi edad referentes a sí van a un gimnasio (sí o no) y sin tienen un índice de masa corporal superior a 25 (sí o no). Si os fijáis en los resultados de la tabla podéis comprobar que la prevalencia de sobrepeso-obesidad entre los que van al gimnasio (50/751, alrededor de un 7%) es mayor que entre los que no van (21/726, alrededor del 3%). ¡Horror!, pienso, no solo me canso, sino que los que van al gimnasio tienen el doble de probabilidades de ser obesos. Conclusión: mañana mismo me borro.

¿Veis lo fácil que es llegar a una conclusión absurda (más bien estúpida, en este caso)?. Pero los datos están ahí, así que habrá que buscar una explicación para entender por qué nos indican algo que va en contra de nuestro sentido común. Y hay varias explicaciones posibles para interpretar estos resultados.

La primera, que realmente ir al gimnasio favorezca que uno engorde. Parece poco probable, pero nunca se sabe… Imaginemos que el entrenamiento motiva que los deportistas coman como fieras durante las seis horas siguientes a la sesión deportiva.

La segunda, que los obesos que van al gimnasio vivan más años que los que no. Pensemos que el ejercicio prevenga la muerte por enfermedad cardiovascular en pacientes obesos. Explicaría por qué hay más obesos (en proporción) en el gimnasio que fuera de él: simplemente se morirían menos que los que no van. Al fin y al cabo estamos tratando con un estudio de prevalencia, por lo que vemos el resultado final en el momento de la medición.

La tercera posibilidad es que la enfermedad pueda influir en la frecuencia de la exposición, lo que se conoce como causalidad inversa. En nuestro ejemplo, podría haber más obesos en el gimnasio porque una de las recomendaciones de tratamiento que se les diese a los obesos fuese esa: apuntarse a un gimnasio. Esta ya no suena tan ridícula como la primera.

Pero todavía hay más posibles explicaciones. Hasta ahora hemos tratado de explicar una asociación entre las dos variables que hemos asumido como real. Pero, ¿y si la asociación no es real?. ¿Cómo podemos obtener una asociación falsa entre las dos variables?. De nuevo, tenemos tres explicaciones posibles.

La primera, nuestro viejo conocido: el azar. Algunos me diréis que podemos calcular la significación estadística o los intervalos de confianza pero, ¿y qué?. Aún en el caso de significación estadística, lo que quiere decir es que no podemos descartar que haya sido el azar con un cierto grado de incertidumbre. Incluso con p<0,05, siempre habrá una probabilidad de que cometamos un error de tipo 1 y descartemos erróneamente el efecto del azar. Podemos medir el azar, pero nunca librarnos de él.

La segunda es que hayamos cometido algún tipo de sesgo que invalide nuestros resultados. A veces, las características de la enfermedad pueden hacer que la probabilidad de elegir a sujetos expuestos y no expuestos no sea la misma, produciéndose un sesgo de selección. Imaginemos que en lugar de una encuesta (telefónica, por ejemplo) hemos usado un registro médico. Puede ocurrir que los obesos que van al gimnasio sean más responsables con el cuidado de su salud y vayan más al médico que los otros, con lo que será más probable que incluyamos obesos deportistas en el estudio, haciendo una estimación al alza de la proporción real. Otras veces el factor de estudio puede ser algo mal visto o estigmatizante desde el punto de vista social, así que los que lo padezcan no tendrán las mismas ganas de participar en el estudio (y reconocer el padecimiento) que los que no, así que su frecuencia se subestimará.

En nuestro ejemplo, podría ocurrir que los obesos que no van al gimnasio respondiesen a la encuesta mintiendo sobre su peso verdadero, con lo cual se clasificarían erróneamente. Este sesgo de clasificación puede ocurrir aleatoriamente en los dos grupos de expuestos y no expuestos, con lo que cual tiende a favorecer la falta de asociación (la hipótesis nula), de tal forma que se subestima la asociación, si es que ésta existe. El problema es cuando este error es sistemático en uno de los dos grupos, ya que esto puede tanto subestimar como infraestimar la asociación entre exposición y enfermedad.

Y, por fin, la tercera posibilidad es que exista una variable confusora que se distribuya de manera diferente entre expuestos y no expuestos. Se me ocurre pensar que los que van al gimnasio son más jóvenes que los que no. Es posible que los obesos más jóvenes tengan más tendencia a ir al gimnasio. Si estratificamos los resultados por la variable confusora, la edad, podemos determinar su influencia en la asociación.

Para terminar, solo me queda pedir disculpas a todos los obesos del mundo por utilizarlos como ejemplo pero es que, por una vez, quería dejar tranquilos a los fumadores.

Como veis, las cosas no son siempre lo que parecen a primera vista, por lo que hay que interpretar los resultados con sentido común y a la luz de los conocimientos existentes, evitando caer en la trampa de establecer relaciones causales a partir de asociaciones detectadas mediante estudios observacionales. Para establecer relaciones de causa y efecto son siempre necesarios estudios experimentales, el paradigma de los cuales es el ensayo clínico. Pero esa es otra historia…