En el evento re:Invent 2024 se ha anunciado una colaboración estratégica cuyo objetivo es acelerar los trabajos de inferencia de inteligencia artificial (IA) mediante la combinación de capacidades computacionales avanzadas de NVIDIA y el software de Amazon SageMaker. Esta alianza, que fortalece la relación continua entre las dos compañías, está destinada a mejorar el soporte para instancias de GPU diseñadas específicamente para la inferencia, integrando las tecnologías más avanzadas de NVIDIA.
En este contexto, se han revelado tres importantes avances que amplían las capacidades de inferencia de IA:
Disponibilidad de los microservicios NVIDIA NIM en AWS Marketplace: Esta novedad facilita la implementación de modelos de IA generativa de última generación para los usuarios de SageMaker Inference, ampliando así el acceso a herramientas avanzadas.
Modelo NVIDIA Nemotron-4 en Amazon SageMaker JumpStart: Este nuevo modelo amplía la selección de modelos preentrenados de alta calidad disponibles para los usuarios. Destaca especialmente por sus habilidades multilingües y excelentes resultados en pruebas de razonamiento.
- Nuevas instancias P5e y G6e optimizadas para la inferencia: Ahora disponibles en Amazon SageMaker, estas instancias ofrecen acceso a las tarjetas gráficas NVIDIA H200 Tensor Core y L40S, mejorando las capacidades para manejar cargas de trabajo de IA más exigentes.
Durante el evento se subrayó cómo estas innovaciones permiten a las organizaciones desplegar modelos de IA generativa con rapidez y escalar sus aplicaciones de manera más efectiva mediante los microservicios de NVIDIA NIM. Además, el modelo NVIDIA Nemotron-4 está completamente integrado en SageMaker JumpStart, lo que facilita su implementación a una amplia gama de clientes.
En cuanto al hardware, las recientes instancias P5e y G6e con tecnología de NVIDIA representan un avance significativo respecto a generaciones anteriores, permitiendo tanto el despliegue como el entrenamiento de modelos de aprendizaje automático más complejos y exigentes.
Este anuncio supone un notable progreso en la accesibilidad y eficiencia para empresas que buscan aprovechar las capacidades avanzadas de inferencia de IA. Las mejoras propuestas facilitan la implementación de innovadoras soluciones en proyectos de diversos sectores industriales. Con estas herramientas, las organizaciones pueden impulsar la innovación y optimizar sus procesos de toma de decisiones mediante una infraestructura flexible y optimizada para gestionar cargas de trabajo complejas y variados casos de uso a escala empresarial.