Adrian RomoAdrian Romo
Alle Texte
Tagesnotiz 1 Min. Lesezeit· curious

Tägliche Notiz: TIL — Polly SSML <mark> Tags

Polly's SSML <mark>-Tags geben Timing-Events über den Stream aus. Nützlich, um Bildschirmunterschriften mit der Sprachwiedergabe zu synchronisieren.

TIL: Pollys <mark> SSML-Tags erscheinen als Timing-Events im Audio-Stream. Wenn du Voice + Screen-Pop machst, kannst du die Untertitel mit dem genauen Wort synchronisieren.

<speak>
  Bitte halte einen Moment, während ich <mark name="lookup"/> dein Konto nachschlage.
</speak>
xml

Auf der Verbraucherseite abonnierst du die Mark-Events und änderst den UI-Zustand, wenn lookup ausgelöst wird. Das ist das fehlende Puzzlestück, das ich für ein latenzfreies Voice+Visual-Erlebnis gebraucht habe, das ich prototypisiere.

Docs: Amazon Polly → "SpeechMarks" → JSON-Event mit time und value.

Weiter geht's

Wohin als Nächstes?

Stöbere durch weitere technische Texte, sieh dir die Engineering Case Studies an oder melde dich direkt.