El desarrollo de un prototipo innovador para la traducción de voz en tiempo real está transformando el soporte al cliente multilingüe en empresas de todo el mundo. Gracias a la colaboración entre Amazon Web Services (AWS) y DXC Technology, se ha creado un sistema de traducción de voz a voz (V2V) que promete revolucionar la interacción en los centros de contacto.
La iniciativa nació a raíz de un desafío significativo que enfrentaba DXC Technology en el tercer trimestre de 2024: la necesidad de atender a clientes que hablan diferentes idiomas con un costo controlado. Antes de esta solución, la empresa exploró diversas opciones, pero encontró limitaciones en cada una de ellas, como restricciones en comunicación y exigencias de infraestructura que afectaban tanto la confiabilidad como la escalabilidad del servicio. Como respuesta, DXC y AWS organizaron un hackathon para definir requisitos críticos para la traducción en tiempo real, estableciendo métricas de latencia y precisión, además de una estrategia de implementación por fases.
El impacto en el negocio ha sido notable. El nuevo prototipo maximiza el talento técnico, permitiendo la contratación de agentes según su especialización sin estar atados a restricciones geográficas o lingüísticas. Con un modelo de traducción basado en el uso, se han logrado reducir considerablemente los costos, eliminando las primeras por experiencia en múltiples idiomas y los gastos asociados con la formación especializada.
El sistema utiliza tecnologías avanzadas de reconocimiento de voz y traducción automática de AWS. Mediante Amazon Connect, la traducción de conversaciones se realiza en tiempo real: el habla del cliente se convierte en texto con Amazon Transcribe, se traduce a través de Amazon Translate, y se convierte nuevamente en audio con Amazon Polly. Este proceso bidireccional garantiza que tanto el agente como el cliente se comuniquen en su idioma preferido, manteniendo una conversación fluida.
Sin embargo, la implementación ha presentado ciertos desafíos. Aunque el sistema se ha optimizado para reducir el tiempo de procesamiento de audio, la experiencia del usuario a menudo no iguala la de una conversación en un mismo idioma. Esto se manifiesta en momentos de silencio en los que ni el agente ni el cliente reciben respuestas mientras las traducciones son procesadas. Para afrontar esta situación, se están investigando complementos de streaming de audio que podrían simular un diálogo más natural y continuo.
A medida que las empresas buscan mejorar su comunicación multilingüe en los centros de contacto, el prototipo V2V de Amazon Connect se presenta como una opción personalizable y puede servir de base para futuras soluciones innovadoras en las comunicaciones. Se espera que esta tecnología no solo supere las barreras del idioma, sino que también mejore la flexibilidad operativa y la experiencia del cliente en un entorno comercial cada vez más globalizado.