Meta ha anunciado la disponibilidad pública de su innovador modelo de segmentación de visión, conocido como Segment Anything Model (SAM) 2.1, a través de Amazon SageMaker JumpStart. Este modelo se distingue por sus avanzadas capacidades de segmentación de imágenes y videos, lo que lo convierte en una herramienta valiosa para diversas industrias, incluyendo la salud, la monitorización ambiental y los sistemas autónomos.
Desarrollado para manejar contextos largos y abordar escenarios de segmentación complejos, el SAM 2.1 es especialmente efectivo en aplicaciones de imágenes médicas, donde la precisión es fundamental. Además, su diseño permite la segmentación de objetos en tiempo real, utilizando simples indicaciones como coordenadas de puntos y cuadros delimitadores.
SAM 2.1 ha sido entrenado en la infraestructura de AWS, convirtiéndose en el primer proveedor en ofrecer este modelo a sus clientes. Se trata de una mejora significativa en términos de precisión, escalabilidad y generalización, lo que lo hace ideal para su implementación en producción. Los usuarios tienen acceso a varias variantes del modelo que se adaptan a diferentes necesidades de rendimiento y tamaño.
Por su parte, SageMaker JumpStart no solo facilita el acceso a SAM 2.1, sino que también ofrece una amplia gama de modelos de fundación preentrenados. Esto permite a los desarrolladores y científicos de datos personalizar los modelos de acuerdo a sus necesidades específicas, eliminando la necesidad de construir desde cero. El despliegue seguro de modelos optimizados en un entorno controlado asegura la protección de datos y el cumplimiento de normativas.
Para comenzar a usar SAM 2.1, los usuarios solo requieren una cuenta de AWS, un rol de IAM para acceder a SageMaker AI, y un entorno adecuado como Amazon SageMaker Studio o una instancia de notebook SageMaker. La interfaz web de SageMaker JumpStart permite descubrir y desplegar modelos fácilmente, así como hacerlo a través del SageMaker Python SDK, brindando flexibilidad para integrar estos modelos avanzados en flujos de trabajo existentes.
Una vez desplegado, SAM 2.1 se puede utilizar para tareas como la generación automática de máscaras para objetos en imágenes o el seguimiento de objetos en videos. La API de SageMaker proporciona una forma sencilla de interactuar con el modelo mediante secuencias de comandos, haciéndolo accesible para investigadores y desarrolladores que trabajan en el ámbito de la minería de datos y la inteligencia artificial.
Finalmente, expertos recomiendan eliminar los puntos finales de SageMaker AI tras finalizar el trabajo con los modelos, con el fin de evitar costos innecesarios asociados al uso prolongado de la infraestructura.