Valor Real en Tiempo Real: Inteligencia Artificial de Producción con Amazon SageMaker y Tecton

Elena Digital López

Las empresas enfrentan una creciente presión para demostrar el retorno de la inversión en inteligencia artificial (IA), tanto en el aprendizaje automático (ML) predictivo como en la IA generativa. A pesar del entusiasmo por estas tecnologías, solo el 54% de los prototipos de ML se implementan con éxito en producción, y apenas el 5% de los casos de IA generativa alcanzan este punto. El desafío no solo es llevar los proyectos a producción, sino también garantizar la precisión y el rendimiento de los modelos, lo cual requiere un sistema escalable y confiable con alta precisión y baja latencia.

La industria de detección de fraudes ilustra la necesidad de baja latencia, pues requiere decisiones rápidas, como las que se toman en el tiempo que lleva pasar una tarjeta de crédito. Con el aumento de los fraudes, más organizaciones buscan implementar eficazmente sistemas de detección. En 2023, las pérdidas por fraude en Estados Unidos superaron los $10 mil millones, un 14% más que en 2022. Se estima que el fraude global en comercio electrónico sobrepasará los $343 mil millones para 2027.

Desarrollar y gestionar aplicaciones de IA precisas y confiables para enfrentar este creciente problema es una tarea compleja. Los equipos de ML suelen comenzar conectando componentes de infraestructura manualmente. Aunque este método pueda funcionar para datos por lotes, se vuelve complicado al incluir fuentes de datos en tiempo real y de transmisión, pasando de inferencias por lotes a servicios en tiempo real.

Los ingenieros enfrentan desafíos al orquestar tuberías de datos, manejar las diversas necesidades de procesamiento de cada fuente, gestionar la infraestructura de cómputo y construir servicios confiables para las inferencias. Sin capacidades como las que ofrece Tecton, la arquitectura resultante sería compleja y difícil de gestionar.

Para facilitar este proceso, Tecton y Amazon SageMaker eliminan la carga de la ingeniería necesaria para las aplicaciones de IA en producción en tiempo real, acelerando el tiempo de obtención de valor y permitiendo que los ingenieros se centren en construir nuevas funcionalidades, en lugar de lidiar con la infraestructura existente.

Tecton proporciona un marco de trabajo declarativo fácil de usar, definiendo las transformaciones necesarias para las características de los modelos y construyendo las tuberías para calcular, gestionar y servir estas características. Su integración con almacenes de datos en disco y en memoria, además de soporte de caché en memoria para API REST de baja latencia, responde a las exigencias de aplicaciones en tiempo real como la detección de fraudes.

Con esta infraestructura, un caso práctico de detección de fraudes se puede completar integrando API de terceros, extrayendo datos históricos y características de comportamiento del usuario, comparando actividades recientes y enviando información a un modelo en SageMaker que evalúe la validez de las transacciones.

Tecton también permite nuevos casos de uso de IA generativa, integrando estas capacidades en aplicaciones existentes para ofrecer experiencias mejoradas, como el uso de modelos de lenguaje de gran escala para la atención al cliente con información contextual adecuada.

En resumen, Tecton y SageMaker ayudan a desplegar aplicaciones de IA de alto rendimiento en tiempo real, sin la complejidad de la ingeniería de datos, abriendo un camino más eficiente hacia la creación de valor mediante la inteligencia artificial.