Ciencia sin seso… locura doble

Píldoras sobre medicina basada en pruebas

Entradas etiquetadasDensidad de incidencia
image_pdf

Unos vienen y otros van

Decía Forrest Gump que la vida es como una caja de bombones. A mí me parece que se parece más a una sala de cine. Ahí estamos nosotros, viendo la película, mientras hay gente que entra y gente que sale. Algunos están mucho tiempo viendo la película, otros se van rápido. Hay quien está desde el principio, incluso desde antes que nosotros, hay quien llega después. En fin, como la vida misma.

Pues lo mismo pasa a veces con los estudios de cohortes o los ensayos clínicos. A veces el número de participantes es el mismo durante toda la duración del estudio, salvo las pérdidas durante el seguimiento, que casi siempre se producen. Pero otras veces los participantes, como si de nuestra vida se tratase, entran y salen del estudio.

Pensemos en un estudio que dura desde enero hasta diciembre. Si se trata de una cohorte abierta, los participantes pueden entrar en el estudio desde el principio o hacerlo más tarde. Por ejemplo, imaginemos un sujeto A que entra desde el principio, uno B que entra en Marzo y otro C que entra en octubre. Una vez que entran en el estudio ocurre una cosa parecida; pueden estar en él hasta el final o abandonarlo antes por tres razones: presentan el evento de estudio, se mueren (los pobres) o se pierden durante el seguimiento por la razón que sea.

Como es fácil de entender, cada paciente contribuye al seguimiento con un número de días determinado y diferente. Si nos limitamos a calcular la incidencia acumulada al final del estudio dividiendo el número de eventos por el número de participantes tendremos una idea aproximada del riesgo de presentar el evento, pero no de cómo de rápido se presenta este riesgo. Para mejorar esta medida tenemos que calcular otra que se llama densidad de incidencia y que refleja el número de eventos por unidad de tiempo-población.

Esta densidad de incidencia sería el equivalente a la incidencia acumulada en los estudios cerrados, donde los participantes tienen todos unos seguimientos similares. Pero, a diferencia de la incidencia acumulada, que es una proporción, la densidad de incidencia es una tasa, ya que incorpora el paso del tiempo en el denominador.

La forma de calcular la densidad de incidencia es dividir el número de eventos nuevos durante el periodo de estudio entre el tiempo total observado para todas las personas del estudio. Por ejemplo, un caso por cada 100 personas-año sería el resultado de encontrar un caso en 100 personas seguidas durante un año o en diez seguidas durante diez años. Para comprender mejor su significado, sería lo mismo que decir que hemos visto un evento por cada 100 personas en cada año de seguimiento.

Como podéis ver, el denominador de esta tasa representa el tiempo total que la población ha estado sometida al riesgo de desarrollar el evento que estemos estudiando. Un problema que tiene este método es que asume que el riesgo es constante durante todo el periodo, lo cual a veces puede no ser reflejo de la realidad. Por ejemplo, en muchas enfermedades crónicas el riesgo va aumentando con el tiempo.

Para terminar, deciros que esta medida puede servir para comparar el riesgo de dos poblaciones, aun cuando el tiempo de seguimiento o de participantes no sea el mismo en los dos grupos. De la misma forma que calculamos el cociente de riesgo en los estudios de incidencia acumulada (el riesgo relativo), podemos calcular el cociente de las densidades de incidencia de dos grupos para calcular la razón de densidades de incidencia, que tiene una interpretación similar a la del riesgo relativo.

Y con esto esto terminado. No hemos hablado nada de cómo consideramos a los que se pierden del estudio. ¿Presentan el evento o no?, ¿enferman o no enferman?. Pues lo que se suele hacer es considerar que han estado bien durante la mitad del periodo durante el que se pierden, sacándose después del estudio. De aquí viene el asunto de los datos censurados de los estudios en los que la variable de resultado es de tipo tiempo hasta producción del evento. Pero esa es otra historia…

La tabla

Existen gran cantidad de tablas. Y tienen un gran papel a lo largo de nuestra vida. Quizás la que primero nos asalta en nuestra más tierna infancia es la tabla de multiplicar. ¿Quién no recuerda con nostalgia, al menos los más mayorcitos, como  repetíamos como loros aquello del dos por uno es dos, dos por… hasta que lo aprendíamos de memoria?. Pero no hicimos más que dominar las múltiples tablas de multiplicar cuando nos topamos con la tabla periódica de los elementos. Otra vez a aprender de memoria, esta vez ayudados de reglas nemotécnicas imposiblemente idiotas sobre Indios que Ganaban Buena Altura y no sé qué.

Pero es con los años cuando llega una de las peores de todas: la tabla de composición de alimentos, con su celda llena de calorías. Esta tabla nos persigue hasta en sueños. Y todo porque comer mucho tiene gran número de inconvenientes, demostrados la mayor parte de ellos gracias a la ayuda de otro tipo de tabla: la tabla de contingencia.

Las tablas de contingencia son usadas muy frecuentemente en Epidemiología para analizar la relación entre dos o más variables. Están formadas por filas y columnas. En las filas se suelen colocar los grupos por nivel de exposición al factor de estudio y en las columnas las diferentes categorías que tienen que ver con el estado de enfermedad o daño que investigamos. Filas y columnas se cruzan para formar celdas donde se representa la frecuencia de esa determinada combinación de variables.

Lo más habitual es que se representen dos variables (nuestra querida tabla 2×2), una dependiente y otra independiente, pero esto no siempre es así. Puede haber más de dos variables y, en ocasiones, puede no existir una dirección de dependencia entre las variables antes de realizar el análisis.

Las tablas 2×2 simples permiten analizar la relación entre dos variables dicotómicas. Según su contenido y el diseño del estudio al que pertenezcan, sus celdas pueden tener significados ligeramente diferentes, lo mismo que ocurre con las medidas que podemos calcular a partir de los datos de la tabla.

contingencia_transversalLas primeras serían las tablas de estudios transversales. En este tipo de estudios se representa una especie de foto fija de nuestra muestra que nos permite estudiar la relación entre las variables. Son, pues, estudios de prevalencia y, aunque los datos se recojan a lo largo de un periodo de tiempo, los resultados representan esa foto fija a la que ya nos hemos referido. En las columnas se coloca la variable dependiente (enfermedad o daño producido) y en las filas la independiente (el grado de exposición), con lo que podemos calcular una serie de medidas de frecuencia, de asociación y de significación estadística.

Las medidas de frecuencia son la prevalencia de enfermedad entre expuestos (EXP) y no expuestos (NEXP) y la prevalencia de exposición entre enfermos (ENF) y no enfermos (NENF). Estas prevalencias representan el número de personas enfermas, sanas, expuestas y no expuestas en relación con el total de cada grupo, por lo que son tasas estimadas en un momento puntual.

Las medidas de asociación son las razones de las prevalencias que acabamos de mencionar según enfermedad y exposición y la odds ratio, que nos dice cuánto más probable es que se produzca la enfermedad respecto a que no se produzca en EXP frente a NEXP. Un valor de estas medidas mayor de uno indica que el factor es de riesgo para que se produzca la enfermedad. Si vale de cero a uno querrá decir que el factor es de protección. Y si vale uno, pues que ni carne ni pescado.

Por último, como en todos los tipos de tablas que vamos a mencionar, se pueden calcular medidas de asociación estadística, fundamentalmente la chi-cuadrado con o sin corrección, la prueba exacta de Fisher y el valor de la p, uni o bilateral.

Muy parecidas a estas que hemos visto son las tablas de los estudios de casos y controles. En estos se trata de ver si diferentes grados de la exposición explican diferentes grados de enfermedad. En la columnas se colocan los casos y los controles y en las filas los EXP y NEXP.

contingencia_casos_controlesLas medidas de frecuencia que podemos calcular son la proporción de casos expuestos (respecto al total de casos) y la proporción de controles expuestos (respecto al total de controles). Lógicamente, podemos calcular también las proporciones de NEXP calculando los complementarios de los anteriores.

La medida de asociación fundamental es la odds ratio, que ya conocemos y en la que no nos vamos a detener mucho. Ya sabéis que, de forma simplificada, podemos calcularla como el cociente de los productos cruzados de la tabla y que nos indica cuánto es más probable contraer la enfermedad en EXP que en NEXP. La otra medida sería la fracción atribuible en los expuestos (FAExp), que nos indica el número de enfermos que son debidos a la acción directa de la exposición.

Podemos, en este tipo de tablas, calcular, además, una medida de impacto: la fracción atribuible en la población (FAPob), que sería el impacto potencial que tendría sobre la población el eliminar el factor de exposición. Si es un factor de riesgo sería un impacto positivo y, a la inversa, si es protector, negativo.

Comentar que las medidas de significación estadística dependerán de que los datos sean pareados (utilizaremos la prueba de McNemar) o no pareados (chi-cuadrado, prueba exacta de Fisher y valor de p).

contingencia_cohortes_acumulada

El tercer tipo de tablas de contingencia es el que corresponde a los estudios de cohortes, aunque la estructura difiere un poco si son estudios de casos nuevos producidos durante todo el periodo de estudio (incidencia acumulada) o si consideran el periodo de tiempo del estudio, el momento de aparición de la enfermedad y el diferente seguimiento de los grupos (tasa de incidencia o densidad de incidencia).

Las tablas de los estudios de incidencia acumulada (IA) son similares a las que hemos visto hasta ahora. En las columnas se representa el estado de enfermedad y en las filas el de exposición. Por otra parte, las de densidad o tasa de incidencia (TI) representan en una de las columnas el número de enfermos y en la otra el seguimiento en personas-año, de forma que los que tienen un seguimiento más prolongado tienen un mayor peso a la hora de calcular las medidas de frecuencia, asociación, etc.

contingencia_cohortes_densidadLas medidas de frecuencia serían los riesgos en EXP (Re) y en NEXP (Ro) para los casos de IA y las tasas de incidencia en EXP (TIe) y NEXP (TIo) en los de TI.

Los cocientes de las medidas anteriores nos permiten calcular las medidas de asociación: riesgos relativos (RR), reducción absoluta de riesgo (RAR) y reducción relativa de riesgo (RRR) para los estudios de IA y reducciones absolutas y relativas de las TI para los estudios de densidad. Podemos calcular también la FAExp como hacíamos con los estudios de casos y controles, al igual que la FAPob como medida de impacto.

En teoría pueden calcularse también las odds ratios, pero suelen ser menos utilizadas en este tipo de tablas. En cualquier caso, ya sabemos que odds ratio y RR se parecerán cuando la prevalencia de la enfermedad sea baja.

Para terminar con este tipo de tablas, podemos calcular las medidas de asociación estadística: chi-cuadrado, Fisher y p para estudios de IA y otras pruebas de asociación para los estudios de densidad de incidencia.

Como siempre, todos estos cálculos pueden realizarse a mano, aunque os recomiendo utilizar calculadoras, como la disponible en la Red CASPe. Es más sencillo, más rápido y, además, nos proporcionan todos estos parámetros con sus correspondientes intervalos de confianza, con lo que podemos estimar también su precisión.

Y con esto hemos llegado al final. Existen más tipos de tablas, con múltiples niveles por tratar más de dos variables, estratificadas según diferentes factores, etc. Pero esa es otra historia…