Beszédszintézis jelölőnyelv - Speech Synthesis Markup Language
A Speech Synthesis Markup Language ( SSML ) egy XML alapú jelölő nyelv a beszédszintézis alkalmazásokhoz. Ez egy ajánlás a W3C által Voice Browser Working Group. Az interaktív telefonos rendszerek meghajtására az SSML gyakran beágyazódik a VoiceXML szkriptekbe. Használható azonban önmagában is, például hangoskönyvek készítéséhez. Az asztali alkalmazásokban más jelölőnyelvek népszerűek, ideértve az Apple beágyazott beszédparancsait és a Microsoft SAPI Text to speech (TTS) jelölését, amely szintén XML nyelv. Hangok előállítására is használják az Azure Cognitive Services 'Text to Speech API-ján keresztül vagy harmadik féltől származó készségek írásakor a Google Assistant vagy az Amazon Alexa számára .
Az SSML a Sun Microsystems által kifejlesztett Java Speech Markup Language (JSML) alapú , bár a jelenlegi ajánlást leginkább beszédszintézis gyártók fejlesztették ki. Gyakorlatilag a szintézis minden aspektusát lefedi, bár egyes területek meghatározatlanok maradtak, ezért minden gyártó elfogadja a nyelv más változatát. Jelölés hiányában a szintetizátor elvárja, hogy saját maga értelmezze a szöveget. Tehát az SSML nem szigorú szabvány a C , vagy akár a HTML értelmében .
Példa
Íme egy példa egy SSML dokumentumra:
<?xml version="1.0"?>
<speak xmlns="http://www.w3.org/2001/10/synthesis"
xmlns:dc="http://purl.org/dc/elements/1.1/"
version="1.0">
<metadata>
<dc:title xml:lang="en">Telephone Menu: Level 1</dc:title>
</metadata>
<p>
<s xml:lang="en-US">
<voice name="David" gender="male" age="25">
For English, press <emphasis>one</emphasis>.
</voice>
</s>
<s xml:lang="es-MX">
<voice name="Miguel" gender="male" age="25">
Para español, oprima el <emphasis>dos</emphasis>.
</voice>
</s>
</p>
</speak>
Jellemzők
Az SSML megfelelő mennyiségű jelölést határoz meg a prozódia számára , ami nem látható a fenti példában. Ez magában foglalja a
- hangmagasság
- körvonal
- hangmagasság tartomány
- mérték
- időtartama
- hangerő
Lásd még
- Kiejtési lexikon specifikáció (PLS)
- Beszédfelismerő nyelvtani specifikáció (SRGS)
- Szemantikai értelmezés a beszédfelismeréshez (SISR)
- SABLE beszédszintézis jelölő nyelv, az SSML, az STML és a JSML kombinációjára szolgál