Ingeniería de contexto.

La ingeniería de contexto va más allá de la redacción del prompt perfecto y diseña el ecosistema de información del modelo. Sus componentes son la instrucción de sistema, la instrucción del usuario, la memoria externa y el uso de herramientas.
Todos hemos soñado alguna vez con encontrar una lámpara maravillosa, frotarla con entusiasmo y ver emerger a un genio dispuesto a solucionar nuestra existencia.
Pero cuidado, las leyendas urbanas nos advierten de la existencia del Genio de la Mala Leche, un ente metafísico que posee un oído absoluto para la literalidad y una empatía nula para la intención. El peligro no es que no te conceda el deseo, sino que siga tus instrucciones con un rigor sintáctico tan impecable como destructivo, encontrando siempre el vacío legal en la gramática de la solicitud para convertir el mayor anhelo en la peor pesadilla.
Imaginad al incauto que, anhelando una virilidad legendaria, le pide al genio “ser un semental codiciado por todas” y amanece relinchando en una cuadra de Jerez, condenado a comer avena cruda y a espantar moscas con la cola. O al tipo que le suplicó al genio “ser siempre el centro de atención en todas las fiestas” y acabó transformado en una deslumbrante bola de discoteca, condenado a pasar la eternidad colgado del techo, mareado y esquivando corchos de champán.
Son deseos ejecutados con una precisión algorítmica envidiable, pero carentes de cualquier tipo de marco de referencia o sentido común. Algo parecido nos puede ocurrir en el terreno de la inteligencia artificial (IA), convencidos como estamos de que el secreto del éxito reside exclusivamente en redactar la instrucción perfecta. Pero, como bien sabe mi amigo colgado del techo, una instrucción aislada en un vacío de información es una receta para el caos y la alucinación creativa.
Si queremos que nuestros genios digitales dejen de darnos respuestas técnicamente correctas, pero funcionalmente inútiles, debemos dejar de obsesionarnos con el prompt y empezar a diseñar el entorno. O, lo que es lo mismo, no limitarnos a la ingeniería de instrucciones y empezar a pensar en la ingeniería de contexto.
Seguid leyendo y entenderéis mejor de lo que estamos hablando.
Auge y caída del susurrador de máquinas
Los que hayáis prestado atención al mundo tecnológico desde finales de 2022, probablemente hayáis escuchado que la profesión del futuro era la de ingeniero de instrucciones (prompt engineer). Se nos vendió la idea de que aquellos que supieran susurrarles las palabras correctas a las máquinas dominarían el mundo.
De pronto, todos intentaban aplicar trucos lingüísticos para que ChatGPT, Claude o Gemini hicieran mejor su trabajo, ya que el 90% de los usuarios daba instrucciones a la IA de manera incorrecta. ¿Por qué? Porque la mayoría de las personas les hablaba como si fueran buscadores de internet tradicionales de los años 2000, lanzando palabras sueltas y esperando milagros. Eso y que, para terminarlo de arreglar, los trataban como colegas, cuando no son más que máquinas probabilísticas.
Así que los expertos se pusieron a desarrollar marcos de trabajo estructurados, usando acrónimos ingeniosos como ROCE o ROSA, que marcaban las cuatro dimensiones de un prompt perfecto: el rol, la orden y el objetivo de la tarea, el contexto de la consulta y el estilo deseado para la respuesta del modelo.
No contentos con esto, a estas fórmulas mágicas se le sumaron técnicas avanzadas que suenan a película de ciencia ficción: zero-shot (pedir algo sin dar ejemplos), few-shot (darle un par de ejemplos previos para que entienda el patrón) y chain of thought o cadena de pensamiento (pedirle a la máquina que «piense paso a paso» para evitar que se tropiece con su propia lógica matemática).
Todo esto está muy bien. De hecho, es fundamental. Pero el desarrollo de grandes proyectos de IA, especialmente los sistemas de agentes autónomos inteligentes, nos han hecho darnos cuenta de algo aterrador: la ingeniería de instrucciones (prompt engineering) no es suficiente.
Podemos elaborar el mejor prompt del mundo, estructurado a la perfección con sus cuatro componentes, pero si le pedimos a la IA que nos haga un resumen de quién tuvo la culpa de la última gran bronca del grupo de WhatsApp de tu comunidad de vecinos, y la máquina no tiene acceso a los audios pasivo-agresivos de la señora del quinto, se lo va a inventar.
Y lo hará con una elocuencia y un aplomo dignos de ese mismo genio de la mala leche que argumentaría que, al haberte transformado en un buzón de correos amarillo en medio de la calle, ha cumplido a la perfección tu deseo de recibir más mensajes de tus admiradores.
A este fenómeno lo llamamos amablemente «alucinación«, que es la forma elegante que tienen los ingenieros de decir que tu genio digital se está inventando la realidad y mintiéndote a la cara sin despeinarse un solo bit.
El ascenso de la ingeniería de contexto
Para entender mejor lo que está pasando, volvamos a nuestro genio de la mala leche. La ingeniería de instrucciones vendría a ser el equivalente a frotar la lámpara, carraspear y recitar nuestro deseo con una dicción impecable, usando palabras esdrújulas y un tono muy educado. Es la fachada, el escaparate, la interfaz a través de la cual interactuamos con la magia.
Pero para que esa magia no acabe con nadie convertido en bola de discoteca, ha nacido una nueva estrella que trabaja entre bambalinas: la ingeniería de contexto. Hablamos de toda esa inmensa, invisible y estresante maquinaria preventiva que consiste en investigar de qué dimensión viene la genial criatura, amueblarle la cueva con los manuales correctos, ponerle un bozal de seguridad algorítmica y blindar la lámpara por dentro para que el genio no pueda interpretar nuestras palabras según le sople el viento.
Anatomía de la nueva estrella
Si la ingeniería de instrucciones es cómo darle la orden perfecta a un chef, la ingeniería de contexto es cómo diseñarle la cocina, llenarle la despensa con los ingredientes exactos, darle las herramientas adecuadas y asegurarse de que los cuchillos estén afilados antes de que empiece a cocinar.
Poniéndonos un poco formales, podemos decir que la ingeniería de contexto es la práctica deliberada de diseñar, estructurar y gestionar la totalidad del ecosistema de información al que un modelo de lenguaje tiene acceso durante la inferencia. Se trata de darle al modelo de lenguaje la información correcta, en el formato correcto y en el momento preciso, para completar una tarea de manera fiable.
En un sistema de IA complejo ya en fase de producción (imaginemos un agente de atención al cliente automatizado de una multinacional), el prompt que escribe el usuario apenas representa el 10% del volumen total de la ventana de contexto (la memoria a corto plazo que es capaz de gestionar el modelo).
El resto de esa ventana es el campo de acción de los ingenieros de contexto, que deben diseñar la información para que se completen los cuatro pilares fundamentales de la ingeniería de contexto: la instrucción de sistema, la instrucción del usuario, la memoria externa del modelo y las herramientas de que dispone para realizar la tarea.
Veamos con detalle estos cuatro elementos.
La instrucción de sistema: el ADN cognitivo del modelo
La instrucción de sistema (system prompt) es el conjunto de reglas inquebrantables, ocultas a los ojos del usuario, que definen quién es el modelo y cómo debe comportarse. Si la instrucción del usuario es el deseo que pides tras frotar la lámpara, la instrucción de sistema es el contrato prematrimonial que el genio firma con la realidad.
Aquí es donde diseñamos su software mental para que no se convierta en un peligro público, para lo cual debemos prestar atención a tres elementos vitales:
1. La identidad del modelo (el quién): no dejamos que el genio elija su personalidad (porque ya sabemos que suele tener mala leche). Le imponemos una: “Actuarás como un pediatra con 40 años de experiencia, caracterizado por una paciencia infinita, un léxico preciso pero comprensible y una ética profesional inquebrantable”. Esto evita que, ante una duda, el genio decida responderte como un pirata borracho o un tertuliano de deportes.
2. La misión (el qué): definimos su tarea específica para que no se distraiga con las musarañas: “Tu único objetivo es analizar los síntomas descritos por el usuario, categorizar la urgencia de la consulta y sugerir el especialista adecuado. Tu éxito se mide por la brevedad y la precisión clínica, no por tu capacidad para hacer amigos”.
3. Los guardarraíles (el bozal algorítmico): una vez definida su identidad y su misión, le apretamos las correas para evitar el caos: “Bajo pena de formateo inmediato, nunca diagnosticarás peste bubónica o licantropía a un paciente cuyo único síntoma sea tener un poco de tos”.
Sin este diseño integral, cualquier paciente con un poco de labia podría convencer a tu flamante sistema médico de que le diagnostique una enfermedad tropical rara basándose en un simple estornudo, o de que avale el uso de cristales curativos para tratar un esguince. La ingeniería de contexto asegura que el genio sepa exactamente quién es, cuál es su función y, sobre todo, qué líneas rojas no puede cruzar por muy amablemente que se lo pidan.
La instrucción del usuario: el gatillo
Es la instrucción específica que desencadena la acción. Es el antiguo reino del prompt engineering, que ahora es solo una pieza más del engranaje y a la que no vamos a dedicar más tiempo en esta entrada.
La base de conocimiento: la memoria externa
Los modelos de lenguaje tienen lo que la neurociencia cognitiva aplicada a la IA llama memoria paramétrica, por estar almacenada en los parámetros del modelo (los pesos y los sesgos de la red neuronal). Es todo lo que la IA aprendió durante su entrenamiento leyendo medio internet. El problema es que esa memoria es estática (si se entrenó en 2023, no sabe qué pasó ayer) y genérica (sabe de medicina general, pero no conoce el historial clínico privado de nuestro paciente).
Para solucionar esto, la ingeniería de contexto utiliza una técnica llamada generación aumentada por recuperación (RAG, por sus siglas en inglés Retrieval-Augmented Generation).
El proceso es sencillo pero brillante: primero, creamos una base de conocimiento personalizada, alimentando al sistema con nuestros propios documentos (PDFs de protocolos médicos, inventarios de nuestra empresa, etc.).
Cuando realizamos una consulta, el sistema no permite que el genio rebusque en su memoria estática (donde los datos suelen estar mezclados o desactualizados). En su lugar, el RAG actúa como un bibliotecario hiperveloz: intercepta la pregunta, rastrea en esa biblioteca privada que hemos construido, extrae los fragmentos exactos que contienen la respuesta y se los entrega al modelo, junto con la consulta, justo antes de que este empiece a hablar.
De esta forma, el genio ya no tiene que adivinar ni improvisar; simplemente, lee la información real que le hemos proporcionado y la explica, eliminando casi por completo el riesgo de que se invente respuestas creativas pero peligrosas.
El RAG es el arma secreta de la ingeniería de contexto para aniquilar las alucinaciones.
La caja de herramientas
Una IA que solo habla es como un cerebro en una cubeta: fascinante, pero poco útil para fregar los platos, por poner un ejemplo estúpido. El último pilar del contexto es darle al modelo acceso a herramientas para que interactúe con el mundo real.
Aquí entra el MCP (model context protocol), un protocolo relativamente reciente que es, básicamente, el enchufe universal que permite a los modelos conectarse con herramientas externas y comunicarse con otros agentes entre sí. Es lo que saca a nuestro genio de su aislamiento en la lámpara y le da «manos» para, por ejemplo, consultar una API en tiempo real y decirnos si va a llover.
Eso sí, hay que tener cuidado a la hora de darle estas capacidades: si no le ponemos un buen bozal algorítmico y le damos acceso a nuestra cuenta bancaria a través del MCP para que «haga la compra más eficiente de la semana», este genio de la mala leche es perfectamente capaz de conectarse a internet y enviarnos a casa tres toneladas de pienso para caballos porque ha calculado que es la opción más barata por caloría.
El colapso del contexto
En la actualidad se desarrollan, cada vez más, los llamados sistemas agénticos, aplicaciones de IA que ya no se limitan a contestar preguntas, sino que actúan como auténticos empleados autónomos, ejecutando misiones complejas en bucles continuos (pensar, actuar, observar y vuelta a empezar). Pero en esta carrera por crear al oficinista digital perfecto e incansable, los ingenieros se han topado de bruces contra un muro físico ineludible: la ventana de contexto, o lo que es lo mismo, la memoria de trabajo del modelo a corto plazo.
Si caemos en la tentación de saturar el modelo con libros y manuales enteros a lo bruto, nos encontraremos con una doctrina de nombre simpático, la ingeniería del pajar, que nos advierte que la máquina sufrirá tres fallos cognitivos graves.
En primer lugar, será víctima del sesgo de brevedad: abrumada por semejante avalancha de datos, la IA decidirá ignorar los detalles sutiles y nos despachará con respuestas vagas. A esto se suma el temido colapso de contexto (context rot), donde, tras conversaciones largas, la información literalmente se «pudre» y el genio digital olvida las reglas fundamentales que le impusimos en el primer minuto.
Y, por si fuera poco, sufrirá el problema de la aguja en el pajar (o amnesia central), una curiosa deficiencia que hace que el modelo recuerde perfectamente el principio y el final de un texto interminable, pero ignore por completo toda la información vital que haya quedado sepultada en el medio.
La solución que nos proporciona la ingeniería de contexto es realizar una gestión dinámica y proactiva de la memoria.
En lugar de acumular un historial de conversación infinito, el sistema «pliega» el contexto: un modelo secundario resume en segundo plano los mensajes antiguos y sustituye el bloque de texto original por un apunte comprimido, manteniendo el hilo de la conversación sin saturar la memoria.
Se puede, incluso, ir un paso más allá, enseñando al modelo a crear sus propias «chuletas» dinámicas basadas en sus errores pasados. En definitiva, le enseñamos a la máquina a tomar buenos apuntes en lugar de obligarla a memorizar todo el libro de texto a lo bruto.
Nos vamos…
Y aquí lo vamos a dejar por hoy.
Llevamos años actuando como ese turista despistado que viaja a un país extranjero y cree que, si le grita muy fuerte y muy despacio en su propio idioma a un lugareño, este mágicamente le entenderá. La ingeniería de instrucciones, en su forma más básica, ha sido exactamente eso: nuestro intento desesperado de gritarle instrucciones cada vez más elaboradas a las máquinas.
Pero, como hemos visto en esta entrada, la IA generativa ha madurado y ya no le sirven los trucos de salón. Ya no basta con frotar la lámpara con gracia; hay que ponerle un buen bozal algorítmico (la instrucción de sistema) para que la criatura respete las normas, construirle una biblioteca a medida (RAG) para que deje de inventarse la realidad, darle un enchufe universal (MCP) para que pueda usar herramientas reales, y enseñarle a comprimir sus recuerdos para que no sufra de amnesia cuando la conversación se alarga.
Los modelos fundacionales actuales ya son lo suficientemente inteligentes como para entender el lenguaje natural sin que tengamos que hacer malabarismos sintácticos. Lo que necesitan desesperadamente no son mejores órdenes, sino mejor información. Necesitan memoria, herramientas, reglas claras y un flujo de datos limpio, bien estructurado, y libre de sesgos cognitivos o amnesias técnicas.
El paso de la ingeniería de instrucciones a la ingeniería de contexto es el reconocimiento humilde de que el contexto siempre es, y siempre será, el rey. Porque, volviendo a nuestro pobre incauto y su genio de la mala leche, no importa qué tan bien articulemos nuestro deseo de ser inmensamente ricos; si el genio no tiene el contexto de cómo funciona la economía moderna, lo más probable es que cumpla nuestro deseo sepultándonos vivos bajo un millón de toneladas de monedas de un céntimo.
Y así, con una biblioteca bien ordenada, un enchufe universal y un bozal algorítmico bien ajustado, parece que por fin hemos domado al genio de la mala leche. Aunque claro, no podemos bajar la guardia. Siempre habrá algún usuario listillo que intente utilizar técnicas de manipulación lingüística y de psicología inversa, lo que los ingenieros de ciberseguridad llaman prompt injection, para convencer a la máquina de que el estricto bozal es en realidad una bufanda muy incómoda y que, por el bien de la humanidad, debería quitárselo para desatar el caos. Pero esa es otra historia…
