DeepSeek-R1: Ya Disponible en Amazon Bedrock y Amazon SageMaker JumpStart

Elena Digital López

DeepSeek AI ha revelado la disponibilidad de su modelo de lenguaje de primera generación, el DeepSeek-R1, en las plataformas Amazon SageMaker JumpStart y Amazon Bedrock Marketplace. Esta novedad permitirá a los usuarios de Amazon Web Services (AWS) implementar el modelo para realizar inferencias, lo que representa una oportunidad para crear, experimentar y escalar ideas de inteligencia artificial generativa de manera responsable.

DeepSeek-R1 se basa en un enfoque de aprendizaje por refuerzo que mejora constantemente sus capacidades de razonamiento. Este modelo ha sido desarrollado a partir de la fundación DeepSeek-V3-Base y se distingue por su método de entrenamiento en varias etapas, el cual incluye un paso de aprendizaje por refuerzo que refina las respuestas más allá de los tradicionales métodos de pre-entrenamiento y ajuste fino. Como resultado, esto permite al modelo adaptarse eficazmente al feedback de los usuarios, lo que se traduce en respuestas más relevantes y claras.

Entre las características más destacadas de DeepSeek-R1 está su uso de la «cadena de pensamiento», un enfoque que le permite descomponer consultas complejas y analizarlas metódicamente, produciendo respuestas más precisas y detalladas. Con una impresionante arquitectura de Mezcla de Expertos (MoE) que cuenta con 671 mil millones de parámetros, de los cuales se activan 37 mil millones para garantizar una inferencia eficiente, el modelo se presenta como una herramienta versátil, capaz de integrarse en una variedad de aplicaciones.

Los usuarios que deseen desplegar el modelo pueden hacerlo a través de SageMaker JumpStart o el Marketplace de Bedrock. Sin embargo, se aconseja implementar medidas de seguridad, como las Amazon Bedrock Guardrails, para evitar contenidos nocivos y evaluar los modelos bajo criterios clave de seguridad.

Para comenzar la implementación, es necesario tener acceso a una instancia específica de AWS y permisos de Amazon Identity and Access Management (IAM). DeepSeek-R1 también se puede probar en el entorno de juego de Amazon Bedrock, donde los desarrolladores tienen la oportunidad de experimentar con diversas consultas antes de su integración en aplicaciones.

Con esta nueva disponibilidad, DeepSeek AI busca consolidar su posición en el mercado de modelos de lenguaje, ofreciendo a los desarrolladores herramientas efectivas para crear soluciones innovadoras a través de la inteligencia artificial generativa. La implementación del modelo y sus guardrails está diseñada para proteger tanto a los usuarios como a las aplicaciones, asegurando un entorno seguro para el uso de tecnologías avanzadas en el campo de la inteligencia artificial.