Reducción de Alucinaciones en IA Generativa mediante Comprobaciones Automatizadas en Amazon Bedrock

Elena Digital López

Los modelos de fundación (FMs) y la inteligencia artificial generativa están transformando las operaciones empresariales en múltiples sectores. Investigaciones recientes indican que esta tecnología podría añadir hasta 4.4 billones de dólares anuales a la economía global, gracias a la mejora en la eficiencia operativa y un crecimiento en la productividad de entre el 0.1% y el 0.6% al año. Además, la inteligencia artificial está optimizando la experiencia del cliente mediante interacciones personalizadas y acelerando la transformación digital en diversas industrias.

Sin embargo, a pesar de estos avances, muchas organizaciones enfrentan un obstáculo significativo conocido como «alucinación de la IA». Este fenómeno ocurre cuando las aplicaciones de inteligencia artificial generan información que, aunque plausible, es incorrecta al ser trasladadas de entornos experimentales a entornos de producción. Un informe reciente revela que el 59% de los encuestados considera los errores de razonamiento derivados de estas «alucinaciones» como una de sus principales preocupaciones. Además, el 48% de los participantes muestra inquietud por la desinformación que podría provenir de actores malintencionados, mientras que el 44% expresa sus reservas acerca de la privacidad.

Para mitigar estos problemas, Amazon Web Services (AWS) ha lanzado una iniciativa de «comprobaciones de razonamiento automatizado», que se presentó en la reciente conferencia AWS re:Invent 2024. Esta innovadora herramienta utiliza algoritmos basados en lógica y validación matemática para verificar las salidas de modelos de lenguaje grande (LLM) en relación con conocimientos del dominio incorporados, ayudando así a prevenir inexactitudes fácticas. Estas verificaciones están integradas en el marco de «Amazon Bedrock Guardrails», que también abarca filtrado de contenido, redacción de información personal identificable (PII) y otras medidas de seguridad.

El razonamiento automatizado se posiciona como una área especializada de la informática que aplica técnicas de prueba matemática y deducción lógica para verificar el cumplimiento de normas y requisitos bajo ciertas supuestos. A diferencia de los enfoques probabilísticos tradicionalmente utilizados en el aprendizaje automático, este tipo de razonamiento proporciona garantías definitivas sobre lo que puede ser demostrado, ofreciendo una claridad invaluable en aplicaciones que requieren alta certeza en sus resultados.

Además, las verificaciones de razonamiento automatizado permiten a las organizaciones establecer políticas que codifiquen sus reglas y procedimientos en formatos estructurados y matemáticos. Esto empodera a expertos en dominios específicos a capturar y mantener el conocimiento adecuado sin depender de intermediarios técnicos, incluyendo la capacidad de traducir el lenguaje natural a lógica para un riguroso proceso de validación.

La implementación de estas herramientas y técnicas se está explorando en sectores que van desde la salud hasta las finanzas, así como en educación y comercio. Este desarrollo resalta la creciente necesidad de mecanismos de validación automatizados que garanticen la precisión y la confianza en las respuestas generadas por la inteligencia artificial. Con la creciente adopción de la inteligencia artificial generativa, se prevé un aumento en la demanda por soluciones de validación, lo que permitirá a las empresas desarrollar aplicaciones de IA más confiables y efectivas.