Implementación de Medidas de Seguridad Autónomas con Amazon Bedrock Guardrails

Elena Digital López

Amazon Web Services (AWS) ha dado un paso importante en el ámbito de la inteligencia artificial generativa con el lanzamiento de Amazon Bedrock Guardrails, un nuevo servicio que estará disponible a partir de abril de 2024. Este servicio busca abordar los desafíos inherentes al uso de modelos de inteligencia artificial generativa, ofreciendo mecanismos de protección personalizados para asegurar la alineación con las políticas de inteligencia artificial responsable de las empresas.

A medida que los modelos de inteligencia artificial generativa ganan popularidad por su capacidad para generar información sobre una amplia variedad de temas, también enfrentan cuestiones críticas como la relevancia del contenido, la protección de información sensible y la prevención de alucinaciones, que son errores o información engañosa generada por estos modelos. Aunque Amazon Bedrock ya cuenta con ciertas protecciones integradas, estas suelen ser específicas de los modelos y podrían no adaptarse completamente a las necesidades particulares de cada organización.

Los desarrolladores frecuentemente se ven obligados a implementar controles adicionales para garantizar la seguridad y privacidad de sus aplicaciones de inteligencia artificial. Este reto se intensifica cuando las organizaciones emplean múltiples modelos de fundación para diversos casos de uso, haciendo crucial el establecimiento de salvaguardias coherentes para facilitar los ciclos de desarrollo y promover un enfoque homogéneo hacia una inteligencia artificial responsable.

Amazon Bedrock Guardrails surge como respuesta a estas necesidades, permitiendo a los desarrolladores implementar salvaguardias personalizadas en aplicaciones de IA generativa. Estas salvaguardias no solo son adaptables a diferentes casos de uso, sino que también pueden aplicarse a múltiples modelos de fundación, mejorando la experiencia del usuario y estandarizando los controles de seguridad.

Una de las características más innovadoras de Amazon Bedrock Guardrails es el API ApplyGuardrail. Esta función evalúa tanto las entradas del usuario como las respuestas del modelo, aplicable incluso a modelos personalizados y de terceros que no formen parte de Amazon Bedrock. Este API es útil en arquitecturas de inteligencia artificial generativa, como los modelos de lenguaje autoalojados o en arquitecturas de Recuperación de Generación Aumentada.

Para demostrar su aplicación, AWS ha presentando un ejemplo práctico donde se implementa un guardrail para evitar que un modelo brinde asesoramiento fiduciario. Este ejemplo utiliza políticas de filtrado que abordan temas prohibidos y verifican la coherencia contextual de las respuestas, garantizando la relevancia y fundamento en información válida para la consulta del usuario.

El anuncio de Amazon Bedrock Guardrails se traduce en un avance notable en la seguridad de las aplicaciones de IA generativa, facilitando que las empresas incorporen salvaguardias estándar y profundamente evaluadas en sus flujos de trabajo, independientemente de los modelos que utilicen. Esto refuerza el compromiso de AWS con la inteligencia artificial responsable y la protección óptima en sus plataformas.