Adrian RomoAdrian Romo
Todos los textos
Nota diaria 1 min de lectura· curious

Nota diaria: Hoy aprendí — etiquetas <mark> de Polly SSML

Las etiquetas <mark> de SSML de Polly emiten eventos de temporización a través del flujo. Son útiles para sincronizar los subtítulos en pantalla con la reproducción de voz.

TIL: Las etiquetas SSML <mark> de Polly se presentan como eventos de temporización en el flujo de audio. Si estás haciendo voz + pantalla emergente, puedes sincronizar los subtítulos con la palabra exacta.

<speak>
  Please hold while I <mark name="lookup"/> look up your account.
</speak>
xml

En el lado del consumidor, te suscribes a los eventos de marca y cambias el estado de la interfaz cuando se activa lookup. Esta es la pieza que me faltaba para una experiencia de voz + visual de baja latencia que he estado prototipando.

Docs: Amazon Polly → "SpeechMarks" → evento JSON con time y value.

Continúa

¿A dónde sigues?

Explora más textos técnicos, revisa los casos de estudio o escríbeme directo.