AWS ofrece una amplia gama de servicios que permiten a los desarrolladores crear aplicaciones en la nube. Al mismo tiempo, las aplicaciones de escritorio de Windows también pueden aprovechar estos servicios. Hoy, estamos lanzando Amazon Polly para Windows, un motor de código abierto que permite a los usuarios aprovechar las voces de Amazon Polly compatibles con SAPI.
¿Qué es SAPI?
SAPI (Speech Application Programming Interface) es una API de Microsoft Windows que permite que las aplicaciones de escritorio implementen síntesis de voz. Cuando una aplicación admite SAPI, puede acceder a cualquiera de las voces SAPI instaladas para generar voz.
Fuera de la caja, Microsoft Windows proporciona una voz SAPI masculina y femenina que se puede usar en cualquier aplicación de voz compatible. Con Amazon Polly para Windows, los usuarios pueden instalar más de 50 voces adicionales en más de 25 idiomas, pagando solo por lo que usan . Para obtener más detalles, visite la documentación de Amazon Polly y consulte la lista completa de voces de texto a voz .
Cree una cuenta de AWS
Si aún no tiene una cuenta de AWS, puede inscribirse aquí que le brinda 12 meses en nuestro nivel gratuito. Durante los primeros 12 meses, Amazon Polly es gratis por los primeros 5 millones de caracteres / mes.
¿Cuántos personajes son esos?
Como ejemplo, “Ulises” de James Joyce tiene 730 páginas y contiene aproximadamente 1.5 millones de caracteres. Entonces, podría hacer que Amazon Polly leyera el libro completo tres veces y aún así tener 500,000 caracteres gratis adicionales durante el resto del mes.
Configure su cuenta
- Inicie sesión en su cuenta de AWS.
- Después de haber conectado, haga clic en Servicios en la barra de menú superior, luego escriba IAM en el cuadro de búsqueda. Haga clic en IAM cuando aparezca.
- A la izquierda, haga clic en Usuarios
- Haga clic en Agregar usuario
- Escriba polly- usuario de Windows (puede usar cualquier nombre)
- Haga clic en la casilla de verificación Acceso programático y deje Acceso a la consola de administración de AWS sin marcar
- Clic en Siguiente: Permisos
- Haga clic en Adjuntar políticas existentes directamente
- En la parte inferior de la página, en el cuadro de búsqueda junto a Filtro: Tipo de política tipo encuesta
- Haga clic en la casilla de verificación junto a AmazonPollyReadOnlyAccess
- Clic en Siguiente: Revisar
- Haga clic en Crear usuario
IMPORTANTE: Don No cierre la página web. Necesitará tanto la ID de la clave de acceso como la clave de acceso secreta en el Paso 3.
Paso 2: Instale la AWS CLI para Windows
Haga clic en aquí para descargar la AWS CLI para Windows.
Paso 3: Configurar el cliente AWS
Amazon Polly para Windows requiere un perfil de AWS llamado polly-windows. Esto garantiza que el motor de Amazon Polly esté utilizando la cuenta correcta.
- Abra un símbolo del sistema de Windows
- Escriba este comando:
- Cuando se le solicite la ID de la clave de acceso de AWS y la clave de acceso secreta de AWS, use los valores del paso anterior.
- Para la región Predeterminada puede presionar Intro para el valor predeterminado (us -east-1) o ingrese una Región diferente. Asegúrese de utilizar todas las minúsculas.
- Para el formato de salida predeterminado, simplemente presione Entrar
- Verifique que esto funcionó ejecutando el siguiente comando. Deberías ver una lista de voces:
Paso 4: Instale el motor Amazon Polly TTS para Windows
Haga clic en aquí para descargar y ejecutar el instalador. Puede verificar que el instalador funcionó correctamente. Amazon Polly para Windows viene con PollyPlayer.
Una aplicación que le permite experimentar con las voces sin software adicional. Simplemente elija una voz, ingrese el texto y luego haga clic en Dígalo .
Uso de voces de Amazon Polly para Windows
Las voces de Amazon Polly están accesibles en cualquier aplicación de Windows que implemente Windows SAPI. Esto significa que después de instalar las voces de Amazon Polly, simplemente debe seleccionar la voz de Amazon Polly que desea usar de la lista de voces en la aplicación.
Amazon Polly admite SSML (Speech Synthesis Markup Language), que permite usuarios para agregar etiquetas para personalizar la generación de voz.
Con Amazon Polly para Windows, los usuarios pueden usar etiquetas de texto sin formato o SSML al enviar solicitudes. El límite estándar de Amazon Polly se aplica a 3000 caracteres máximos facturados por solicitud, o un total de 6000 caracteres (las etiquetas SSML no se facturan).
Ejemplo: Uso de Amazon Polly para Windows con Adobe Captivate
Creación de eLearning El contenido es un gran caso de uso para el discurso generado. En el pasado, los administradores de contenido debían grabar contenido de voz y luego volver a grabar a medida que cambiaba el contenido.
El uso de un diseñador de eLearning como Adobe Captivate junto con las voces de Amazon Polly le permite crear fácilmente y actualizar dinámicamente el contenido cuando lo necesite.
Puede usar cualquier solución de eLearning habilitada para SAPI. En esta demostración, mostramos cómo crear una diapositiva simple con Captivate para mostrar qué tan rápido y fácil puede agregar contenido de voz. Si aún no tiene Captivate, puede descargar una versión de prueba gratuita aquí .
Paso 1: Cree un proyecto
Inicie Captivate y haga clic en Nuevo proyecto / Proyecto en blanco para crear un nuevo proyecto.
En este punto, tiene un nuevo proyecto en blanco con una sola diapositiva.
Paso 2: Agregue contenido de voz
Desde el Audio haga clic en Administración de voz.
Esto abre una ventana modal Administración de voz donde puede agregar contenido de voz a la diapositiva. Haga clic en el menú desplegable Speech Agent y seleccione Amazon Polly – Inglés de EE. UU. – Salli (Neural) . De forma predeterminada, todas las diapositivas usan esta voz.
Haga clic en el botón + para agregar contenido.
En el cuadro de texto, escriba Me llamo Salli Mi discurso es generado por Amazon Polly.
Ahora debemos generar el audio. Detrás de escena, Captivate usa el controlador SAPI de Windows para volver a llamar a AWS para generar el discurso. Haga clic en Guardar y Generar audio .
Después de generar el discurso, puede obtener una vista previa del audio haciendo clic en el botón Reproducir siguiente al botón Generar audio .
Escuchas a Salli hablando el texto. Haga clic en el botón Cerrar .
Después de cerrar la ventana, puede previsualizar todo el proyecto para escuchar el discurso con la diapositiva.
La amplia selección de voces de Amazon Polly permite Un administrador de contenido para construir y experimentar con combinaciones ilimitadas de discurso.
Debido a que el contenido y las selecciones de voz se pueden actualizar en cualquier momento, los administradores de contenido pueden mantener actualizadas tanto la presentación de audio como el contenido sin tener que acercarse a un estudio de grabación.
Ahora que ha instalado Amazon Polly para Windows, puede tener es divertido experimentar con diferentes variaciones del habla usando etiquetas SSML que son totalmente compatibles con Windows.
Y dado que Amazon Polly para Windows es de código abierto puede contribuir libremente con las funciones y enviar solicitudes de funciones . Puede compartir comentarios en el foro de Amazon Polly . ¡Nos encantaría saber cómo está utilizando Amazon Polly para Windows!