Un punto débil

Hasta los más grandes tienen puntos débiles. Es una realidad que afecta incluso al gran NNT, el número necesario a tratar, sin duda el rey de las medidas de impacto absoluto de la metodología de investigación en los ensayos clínicos.

Claro que eso no es una desgracia irreparable. Únicamente tenemos que ser bien conscientes de sus fortalezas y debilidades para poder aprovechar las primeras y tratar de mitigar y controlar las segundas. Y es que el NNT depende de los riesgos basales de los grupos de intervención y de control, que pueden ser unos compañeros de viaje poco constantes y sujetos a variación por diversos factores.

Como todos sabemos, el NNT es una medida absoluta de efecto que se utiliza para estimar la eficacia o seguridad de una intervención. Este indicador, como si de un buen matrimonio se tratase, es útil en lo bueno y en lo malo, en la salud y en la enfermedad.

Así, en el lado bueno hablamos del NNT, que es el número de pacientes que es necesario tratar para que uno presente un resultado que consideramos bueno. Por otra parte, en el lado oscuro tenemos el número necesario a dañar (NND), que indica a cuántos tenemos que tratar para que uno presente un evento adverso.

En un principio se ideó para describir el efecto de la intervención respecto al grupo control en los ensayos clínicos, aunque posteriormente se extendió su uso para interpretar los resultados de las revisiones sistemáticas y de los metanálisis. Y aquí es donde puede surgir el problema ya que, a veces, se generaliza la forma de calcularlo en los ensayos para los metanálisis, lo cual puede llevarnos a error.

La forma más sencilla de obtener el NNT es calcular el inverso de la reducción absoluta del riesgo entre el grupo de intervención y el de control. El problema es que esta forma es la que es más susceptible de verse sesgada por la presencia de factores que pueden influir en el valor del NNT. Aunque es el rey de las medidas absolutas de impacto, también tiene sus limitaciones, siendo diversos los factores que pueden influir en su magnitud, por no hablar de su significado clínico.

Uno de estos factores es la duración del periodo de seguimiento del estudio. Esta duración puede influir sobre el número de eventos, buenos o malos, que puedan presentar los participantes del estudio, lo que hace que no sea correcto comparar los NNT de estudios con seguimientos de distinta duración.

 Otro puede ser el riesgo basal de presentar el evento. Pensemos que el término “riesgo”, desde el punto de vista estadístico, no implica siempre algo malo. Podemos hablar, por ejemplo, de riesgo de curación. Si el riesgo basal es mayor, se producirán probablemente más eventos y el NNT puede ser menor. También habría que tener en cuenta la variable de resultado utilizada y la alternativa de tratamiento con que comparamos la intervención.

Y, en tercer lugar, por mencionar algunos más de estos factores, pueden influir la dirección y el tamaño del efecto, la escala de medida y la precisión de las estimaciones del NNT, sus intervalos de confianza.

Fórmulas para el cálculo del NNTY aquí surge el problema con las revisiones sistemáticas y los metanálisis. Por mucho que queramos, siempre habrá cierto grado de heterogeneidad entre los estudios primarios de la revisión, por lo que estos factores que hemos comentado pueden ser diferentes entre los distintos estudios. Llegados a este punto, es fácil comprender que la estimación del NNT global en base a las medidas resumen de riesgos entre los dos grupos puede no ser la más indicada, ya que se ve muy influida por las variaciones del riesgo basal en los controles (RBC).

Para estos casos, es mucho más recomendable realizar otras estimaciones más robustas del NNT, siendo las más utilizadas las que emplean otras medidas de asociación como el riesgo relativo (RR) o la odds ratio (OR), que son más robustas ante variaciones del RBC. En la figura adjunta os pongo las fórmulas para el cálculo del NNT utilizando las diferentes medidas de asociación y efecto.

De todas formas, no hay que perder de vista la recomendación de no realizar síntesis cuantitativa ni cálculo de medidas resumen si existe una heterogeneidad importante entre los estudios primarios, ya que entonces las estimaciones globales serán poco fiables, hagamos lo que hagamos.

Pero no creáis que hemos solucionado el problema. No podemos terminar esta entrada sin mencionar que también estos métodos alternativos para el cálculo del NNT tienen su punto débil. Este tiene que ver con la obtención de un valor resumen global del RBC, que también varía entre los estudios primarios.

La forma más sencilla sería dividir la suma de eventos en los grupos control de los estudios primarios entre el total de participantes en dicho grupo. Esto suele ser posible simplemente tomando los datos del forest plot del metanálisis. Sin embargo, este método es poco recomendable, ya que ignora totalmente la variabilidad entre los estudios y las posibles diferencias en la aleatorización.

Otra forma más correcta sería calcular la media o la mediana de los RBC de todos los estudios primarios e, incluso mejor, calcular alguna medida ponderada en función de la variabilidad de cada estudio.

Incluso, si las variaciones del riesgo basal entre los estudios son muy importantes, podría utilizarse una estimación basada en los conocimientos del investigador o en otros estudios, así como utilizar un intervalo de valores posibles del RBC y comparar las diferencias entre los distintos NNT que podrían obtenerse.

Hay que tener mucho cuidado con los métodos de ponderación por la varianza de los estudios, ya que el RBC tiene la fea costumbre de no seguir una distribución normal, sino una binomial. El problema con la distribución binomial es que su varianza depende enormemente de la media de la distribución, siendo máxima en valores de la media alrededor de 0,5.

Por el contrario, la varianza disminuye si la media se encuentra próxima a 0 o a 1, con lo que todos los métodos de ponderación basados en la varianza asignarán un peso mayor a los estudios cuánto más se separe su media del 0,5 (recordemos que el RBC puede valer de 0 a 1, como cualquier otro valor de probabilidad). Por este motivo, es necesario realizar una transformación para que los valores se aproximen a una normal en lugar de a una binomial y poder así realizar la ponderación.

Y creo que aquí lo vamos a dejar por hoy. No vamos a entrar en los métodos para transformar el RBC, como el del doble arcoseno o el de la aplicación de modelos lineales generalizados mixtos, ya que eso queda para las mentes más exclusivas, entre las cuales no se incluye la de un servidor. De todas formas, no os compliquéis la vida. Os aconsejo que calculéis el NNT utilizando paquetes estadísticos o calculadoras, como Calcupedev. Existen otros usos del NNT que también podríamos comentar y que pueden obtenerse con estas herramientas, como es el caso de los NNT en los estudios de supervivencia. Pero esa es otra historia…