CereProc - CereProc
Fejlesztő (k) | CereProc Ltd., Egyesült Királyság |
---|---|
Első kiadás | 2005 |
Stabil kiadás | 2013. július
|
Beírva | C / Python |
Operációs rendszer | Cross-platform |
Elérhető | Angol, német, francia, spanyol, olasz, holland, katalán, román, japán, portugál, skót gael, svéd, lengyel, ír |
típus | Szövegfelolvasás |
Engedély | Kereskedelmi |
Weboldal | www |
CereProc ( / s ɛ r ə ˌ p r ɒ k / SERR -ə-Prok ) egy beszédszintetizátor cég székhelye Edinburgh, Skócia, 2005-ben alakult Cégünk létre természetes és kifejező hangzású szöveget beszéddé hangokat, szintézishangok regionális akcentussal és hangklónozással .
Hangépítési technológia
A CereProc két különböző hangépítési technológiával hoz létre hangokat: egységválasztási szintézis és parametrikus modellezés.
A CereProc egységválasztó hangjai a rögzített beszéd nagy adatbázisaiból épülnek fel. Az adatbázis létrehozása során minden rögzített mondanivalót az alábbiak egy részére vagy mindegyikére szegmentálunk: egyes telefonok , szótagok , morfémák , szavak , kifejezések és mondatok . A szegmensekre bontás egy speciálisan módosított beszédfelismerővel történik . Egy index az egység a beszéd adatbázisban azután létrehozása a szegmentáció és akusztikai paraméterek, mint az alapfrekvencia ( pitch ), időtartama, pozícióját a szótag, és a szomszédos telefonok. Futás közben a kívánt célbeszédet úgy hozzák létre, hogy meghatározzák az adatbázisból a legjobb jelölt egységláncot (egységválasztás). Az egységválasztás biztosítja a legnagyobb természetességet, mert a digitális jelfeldolgozást (DSP) csak rögzített pontokon alkalmazza a rögzített beszédre. A DSP gyakran kevésbé természetesvé teszi a rögzített beszéd hangját.
A CereProc paraméteres hangjai statisztikai modellezési módszereken alapuló beszédszintézist eredményeznek. Ebben a rendszerben egyszerre modellezik a beszéd frekvenciaspektrumát ( vokális traktus ), alapvető frekvenciáját (vokális forrás) és időtartamát ( prozódiája ). A beszéd hullámformákat ezekből a paraméterekből állítják elő egy vokoder segítségével . Kritikusan elmondható, hogy ezek a hangok lényegesen kevesebb rögzített beszédből építhetők fel, mint az egységválasztó hangok, és telepítéskor sokkal kisebb a lábnyomuk, emiatt privát hangklónozásra használják őket.
Hangok és nyelvek
A CereProc negyvenhat általánosan elérhető hanggal rendelkezik, amelyek tizennégy nyelven beszélnek, különböző regionális akcentusokkal:
- Amerikai angol: Isabella, Katherine, Hannah, Megan, Adam, Nathan, Andy (gyermekhang), Jordan (gyermekhang), Carolyn
- Brit angol: Sarah, William, Jack, Lauren, Giles, Amy
- Északi angol: Jess
- Skót angol: Heather, Kirsty, Stuart, Andrew (gyermekhang), Mairi (gyermekhang)
- Glasgow angol: Dodo
- Lancashire angol: Claire
- Ír angol: Caitlin
- West Midlands angol: Sue
- Speciális FX hangok: Démon, Szellem, Goblin, Pixie, Robot
- Metropolitan French: Suzanne, Laurent
- Kanadai francia: Firenze
- Katalán: Rita
- Kasztíliai spanyol: Sara
- Latin-amerikai spanyol: Ana
- Olasz: Laura, Dario
- Ír: Peig
- Holland: Ada
- Németül: Gudrun, Alex
- Osztrák német: Leopold
- Portugál: Lúcia
- Brazil portugál: Gabriel
- Japán: Yuki
- Skót gael: Ceitidh
- Svédül: Ylva
- Lengyelül: Pola
- Románul: Daria
- Francia ékezetes angol: Nicole
- Orosz: Avrora
- Mandarin: Mailin
Ezenkívül a társaság számos olyan hírességi hangot fejlesztett ki, amelyek általában nem elérhetők a nyilvánosság számára. Ide tartozik George W. Bush , Barack Obama és Arnold Schwarzenegger .
Hangklónozás
2009-ben Roger Ebert filmkritikus a CereProc-ot alkalmazta hangjának szintetikus változatának elkészítéséhez. Ebert elveszítette a beszéd erejét a pajzsmirigyrák kezelésére irányuló műtétet követően . A CereProc kazettákat és DVD-kommentárokat bocsátott ki Ebert hangjával, hogy olyan szövegfelolvasó hangot hozzon létre, amely jobban hasonlít az övéire. Roger Ebert a hangot használta 2010. március 2-i fellépésén az Oprah Winfrey Show-ban .
Az NFL játékosának, Steve Gleasonnak a hangját a CereProc klónozta az MND diagnózisát követően . Gleason megjelent Microsoft „s Super Bowl XLVIII kereskedelmi dícsérve a hatalom a technológia segítségével a gépi hang elbeszélni.
A CereProc hangklónozási technológiát jelenleg az Egyesült Királyságban használják az MND-ben szenvedők, hogy szintézishangokat hozzanak létre, mielőtt elveszítenék a beszéd erejét. Ezt a folyamatot egy BBC Radio 4 dokumentumfilm, a Visszaadva a kritikus hangját mutatta be , amelyet 2011 augusztusában sugároztak.
A rendszer kompatibilitása
A CereProc hangok különböző operációs rendszereken és különböző típusú eszközökön telepíthetők . A CereProc asztali hangok kompatibilisek a Microsoft Windows és az Apple Mac OS X rendszerekkel . Rendszerhangként telepítik őket, és más beszédet támogató alkalmazások képesek használni őket. A CereProc kliens / szerver rendszere, a cServer, amely elsősorban a vállalati IVR piacra irányul, Windows és Linux rendszereken futtatható . A CereProc Mobile hangok Androidra és Apple iOS-re telepíthetők . Az SDK elérhető Android, Linux, MacOS, iOS és Windows rendszerekhez. Az SDK rendelkezik C / C ++, C #, Java és Python kötésekkel.
Lásd még
Hivatkozások
Külső linkek
- Hivatalos honlapján
- Roger Ebert bemutatja CereProc hangját a TED2011- en 7: 28-kor