Ciencia sin seso… locura doble

Píldoras sobre medicina basada en pruebas

La unión hace la fuerza

This post is also available in: Inglés

image_pdf

¿Cuántas veces habremos escuchado esta frase u otras por el estilo?. Las ventajas de trabajar juntos, en equipo, están perfectamente demostradas. Casi nadie niega el hecho de que dos (o más) cabezas piensan mejor que una. Pero el trabajo en equipo también tiene sus puntos oscuros, ya que dentro del equipo suele haber diversidad de caracteres que pueden enturbiar la armonía que debería reinar dentro del grupo. Si estas divergencias son lo suficientemente importantes puede arruinarse la colaboración y hacer que sea más ventajoso el esfuerzo individual que el colectivo.

Y este mismo razonamiento puede aplicarse al uso de variables de resultados en los estudios científicos. En ocasiones, generalmente para aumentar la frecuencia del número de eventos de estudio que se producen y disminuir las necesidades de un tamaño muestral mayor, los investigadores combinan varias variables de resultado en un único evento, que se denomina variable de resultado compuesta.

Un ejemplo frecuente es la variable compuesta MACE, muy utilizada en Cardiología, y que incluye muerte, infarto, ictus, revascularización coronaria, reestenosis, isquemia recurrente y rehospitalización. Considerando un evento producido cuando se produce cualquiera de las situaciones se consigue un mayor número de eventos que si hay que medir cada uno de ellos por separado. En consecuencia, el tamaño muestral necesario para detectar diferencias significativas se reduce.

El problema con las variables compuestas es que, en muchas ocasiones, se abusa de ellas y no se cumplen una serie de requisitos para su correcta utilización. Además, como los componentes de la variable suelen variar de un ensayo a otro, contribuyen enormemente a la heterogeneidad entre estudios, lo que puede dificultar el llegar a conclusiones globales.

Idealmente, todos los componentes deberían ser intercambiables y cumplir tres condiciones. Primera, tener más o menos la misma importancia desde el punto de vista clínico. Segunda, todos los componentes deberían ocurrir con una frecuencia similar. Y tercera, deberían tener una sensibilidad al tratamiento similar.

Sin embargo, estas condiciones no se cumplen prácticamente nunca. Lo habitual es combinar algunos componentes duros e infrecuentes (el más duro de todos es la mortalidad) con otros no tan graves y más frecuentes. Esto tiene como consecuencia que son los efectos más frecuentes (y, por tanto, menos graves) los que suelen condicionar la frecuencia de la variable de resultado compuesta y la sensibilidad para detectar el efecto de la intervención.

Otra cosa que no debe hacerse es combinar variables que responden a diferentes mecanismos fisiopatológicos o formar una variable compuesta con componentes con gran gradiente de importancia clínica o de susceptibilidad al tratamiento.

Este hecho se hace muy evidente cuando se combinan resultados de seguridad con resultados de eficacia para valorar un beneficio clínico neto. Si la intervención es muy eficaz, la valoración neta puede enmascarar la existencia de efectos perjudiciales, sobre todo si no se hace una ponderación de los distintos componentes de la variable compuesta.

Esta combinación de seguridad y eficacia en la misma variable de resultado plantea un problema adicional en los estudios de no inferioridad. Puede ocurrir que una intervención poco eficaz pero muy segura pueda parecer tan buena o mejor que la intervención del grupo de comparación.

Por último, la heterogeneidad de la susceptibilidad al efecto de la intervención de los distintos componentes de la variable puede también plantear problemas a la hora de interpretar los resultados. Por ejemplo, puede producirse un efecto positivo sobre los componentes de menor importancia clínica y afectarse de forma negativa los de mayor importancia (como la mortalidad). Si se da este hecho, el efecto neto puede ser beneficioso por la mayor frecuencia de los componentes más leves, aunque tenga más trascendencia desde el punto de vista clínico el efecto negativo sobre los más graves, mucho menos frecuentes.

Una solución a este problema puede ser asignar una ponderación a cada uno de los componentes de la variable. El problema es que esto es bastante subjetivo y, además, puede disminuir la potencia del estudio, con lo que se pierde el beneficio teórico de usar variables compuestas.

¿Qué hacemos entonces?. ¿Nos olvidamos de las variables de resultado compuestas?. Pues yo creo que no hay necesidad de tanto. Solo conviene seguir una serie de recomendaciones cuando queramos emplearlas para hacerlo con unas garantías máximas: 1) deberá justificarse la validez de cada componente individual; 2) evitaremos utilizar componentes con poca importancia desde el punto de vista clínico; 3) no incluiremos componentes con poca probabilidad de influirse por la intervención; 4) tendremos que describir la variable compuesta y sus componentes por separado; 5) valorar la heterogeneidad del efecto del tratamiento sobre cada uno de los componentes; 6) ponderar los componentes según su importancia clínica; y 7) hacer un análisis de sensibilidad para determinar cómo afectan los resultados el uso de la ponderación de los componentes de la variable compuesta.

Y con esto terminamos por hoy. Hemos tenido la oportunidad de reflexionar sobre una más de las múltiples herramientas que, a menudo, se utilizan de forma incorrecta en los trabajos que vemos publicados en revistas científicas, incluso de alto impacto. Y no es la única. Hay muchas más de las que se abusa para conseguir los resultados buscados. Por ejemplo, se me viene a la cabeza el caso de las comparaciones múltiples de subgrupos. Pero esa es otra historia…

Deja un comentario

A %d blogueros les gusta esto: