Innovación en la Gestión del Conocimiento: El Prototipo de IA de VW y AWS

Elena Digital López

Volkswagen, el gigante automotriz europeo, ha dado un importante paso en la transformación digital de su gestión del conocimiento al poner en marcha una innovadora solución basada en inteligencia artificial generativa. En colaboración con el equipo de Prototipado e Ingeniería de Clientes de AWS (AWSI-PACE), VW ha desarrollado un prototipo que utiliza los modelos avanzados Claude 3 de Anthropic en Amazon Bedrock. Este desarrollo permite extraer y analizar información de documentos complejos en formato PDF, combinando texto e imágenes, optimizando así la precisión y eficiencia en sus operaciones de producción.

El desafío principal enfrentado por Volkswagen fue crear un sistema que pudiera gestionar y procesar datos en un entorno multimodal, garantizando tanto la precisión como la accesibilidad de la información almacenada. La solución implementada utiliza la arquitectura de Recuperación de Generación Aumentada (RAG), lo que le permite a VW mejorar significativamente su manejo interno de información.

El sistema se sustenta en un backend nativo sin servidor de AWS, que destaca por su eficiencia, escalabilidad y fiabilidad. Integra servicios como Amazon S3 para almacenamiento de datos, Amazon Kendra para búsquedas semánticas, y Amazon Bedrock para análisis e inferencia de datos. Los modelos de visión de Claude 3 son cruciales para entender y analizar tanto imágenes como texto, lo que resulta fundamental para la extracción de información de documentos complejos.

El flujo de trabajo comienza cuando el usuario carga un documento PDF a través de una interfaz web facilitada por Amazon CloudFront. Una vez cargado, el archivo se almacena en Amazon S3, permitiendo a Amazon Kendra indexar el texto mientras una función Lambda extrae y procesa imágenes a través de Amazon Bedrock para obtener texto contextual relevante. Este texto se almacena nuevamente en S3 y se indexa por Kendra, mejorando así la búsqueda y consulta.

Además de gestionar documentos en alemán, el sistema presenta capacidades multilingües, permitiendo manejar consultas y ofrecer respuestas tanto en alemán como en inglés. Esto amplía considerablemente su accesibilidad, facilitando una experiencia de usuario fluida y eficiente para quienes interactúan con documentos en diferentes idiomas.

Los resultados del proyecto han sido notables: no solo se ha optimizado la búsqueda semántica, sino que también se ha mejorado la experiencia del usuario mediante la integración de capacidades multilingües. Estas innovaciones han ampliado el alcance del sistema para los usuarios de Volkswagen, quienes ahora pueden acceder a información de manera más precisa y contextual.

Stefan Krawinkel, representante de Volkswagen, expresó su satisfacción con los logros alcanzados, destacando la colaboración y la capacidad de la inteligencia artificial generativa para superar desafíos complejos. Este proyecto no solo ha superado barreras tecnológicas actuales, sino que ha abierto nuevas posibilidades para innovaciones futuras en la industria automotriz.