Construir Aplicaciones RAG Rentables con Embeddings Binarios en Amazon Titan V2, OpenSearch y Bedrock

X (Twitter) Facebook Pinterest Email WhatsApp

Hoy se ha anunciado una innovación significativa en el ámbito del desarrollo de aplicaciones tecnológicas con la introducción de las incrustaciones binarias para Amazon Titan Text Embeddings V2. Esta nueva capacidad estará disponible en las Amazon Bedrock Knowledge Bases y en Amazon OpenSearch Serverless. Con esta evolución, las empresas podrán crear aplicaciones de Recuperación y Generación Aumentada (RAG) de manera más eficiente, optimizando el uso de memoria y reduciendo costos.

La capacidad mejorada de Amazon Titan Text Embeddings V2 permite generar representaciones semánticas de documentos, párrafos y oraciones con dimensiones configurables de 1,024, 512 o 256 bits. Ahora, con la incorporación de incrustaciones binarias, los datos se pueden almacenar como vectores binarios, aumentando la eficiencia tanto del almacenamiento como de la computación.

Paralelamente, la opción sin servidor de Amazon OpenSearch Service potencia la experiencia de búsqueda con soporte para algoritmos de vecino más cercano, exactos y aproximados. Este avance se traduce en búsquedas más veloces y almacenamiento de vectores más económico gracias a la utilización de índices binarios.

Los beneficios tangibles de esta nueva funcionalidad han sido sustentados por un benchmark utilizando el conjunto de datos de recuperación Massive Text Embedding Benchmark (MTEB). Se registró una mejora de 25 veces en la latencia y la precisión de recuperación se mantuvo en 98.5% con reordenamiento y 97% sin él, cifras que se acercan notablemente a las obtenidas con incrustaciones de precisión completa.

Además, pruebas realizadas con el algoritmo HNSW han mostrado una reducción del 50% en el uso de Unidades Computacionales de OpenSearch, lo que representa un ahorro significativo en costos. El uso de las distancias de Hamming en este contexto maximiza la eficiencia, especialmente frente a métodos más tradicionales que demandan un mayor consumo de recursos computacionales.

Esta nueva característica ya está implementada y disponible en todas las regiones de AWS donde se habilitan los servicios de Amazon Bedrock y Amazon OpenSearch Serverless. Los usuarios interesados pueden comenzar a explorar estos beneficios accediendo a la consola de Amazon Bedrock y participando en la comunidad AWS para ofrecer retroalimentación y contribuir a la conversación sobre inteligencia artificial generativa.

Para obtener más información sobre las soluciones de Amazon Bedrock y Amazon OpenSearch Serverless, así como orientación sobre cómo implementar estas nuevas capacidades, se recomienda consultar la documentación oficial y las páginas de producto correspondientes en el sitio web de AWS.