Ambisonics - Ambisonics

Ambisonics korábbi védjegye

Az Ambisonics egy teljes körű térhatású hangformátum : a vízszintes síkon kívül lefedi a hallgató feletti és alatti hangforrásokat.

Más többcsatornás surround formátumokkal ellentétben az átviteli csatornái nem hordoznak hangszórójeleket. Ehelyett a B-formátumú hangmező hangszórófüggetlen ábrázolását tartalmazzák , amelyet ezután dekódolnak a hallgató hangszóró beállításához. Ez az extra lépés lehetővé teszi a gyártó számára, hogy a hangszóró pozíciói helyett a forrásirányokban gondolkodjon, és jelentős rugalmasságot kínál a hallgatóknak a lejátszáshoz használt hangszórók elrendezése és száma tekintetében.

Az Ambisonics -t az Egyesült Királyságban fejlesztették ki a hetvenes években a British National Research Development Corporation égisze alatt .

Szilárd technikai megalapozása és számos előnye ellenére az Ambisonics a közelmúltig nem volt kereskedelmi siker, és csak a réses alkalmazásokban és a felvételi rajongók között maradt fenn.

Az erőteljes digitális jelfeldolgozás könnyű hozzáférhetőségével (szemben az első években használt drága és hibára hajlamos analóg áramkörökkel) és a házimozi térhatású hangrendszereinek sikeres piaci bevezetésével az 1990-es évek óta, az Ambisonics iránti érdeklődés felvételi mérnökök, hangtervezők, zeneszerzők, médiavállalatok, műsorszolgáltatók és kutatók visszatértek, és folyamatosan növekednek.

Bevezetés

Az ambisonika az M/S (középső/oldalsó) sztereó háromdimenziós kiterjesztésének tekinthető , amely további különbségi csatornákat ad hozzá a magassághoz és a mélységhez. A kapott jelkészletet B-formátumnak nevezzük . Alkatrészcsatornáit a hangnyomás (az M M/S), az elülső-mínusz-hátsó hangnyomás-gradiens, a bal-mínusz-jobb (az S az M/S) és a fel-mínusz-le jelzi .

A jel egy körirányú mikrofonnak felel meg, míg azok az alkatrészek, amelyeket a nyolc térbeli tengely mentén elhelyezett nyolc-nyolc kapszula vesz fel.

Forrás pásztázása

Egy egyszerű Ambisonic panner (vagy kódoló ) forrás jelet és két paramétert vesz fel , a vízszintes szöget és a magassági szöget . A kívánt szögben pozícionálja a forrást azáltal, hogy elosztja a jelet az Ambisonic komponenseken, különböző nyereségekkel:

Mivel a csatorna körirányú, a szögektől függetlenül mindig ugyanazt az állandó bemeneti jelet kapja. Annak érdekében, hogy többé-kevésbé ugyanaz az átlagos energiája legyen, mint a többi csatornának, a W körülbelül 3 dB-rel csillapodik (pontosan osztva a négyzetgyökével). A kifejezések valójában nyolcnyolc mikrofon poláris mintáit hozzák létre (lásd a jobb oldali, második sorban lévő ábrát). Vesszük az értékük , és , és szorozzuk meg az eredményt a bemenő jelet. Az eredmény az, hogy a bemenet minden komponensben pontosan olyan hangos, mint a megfelelő mikrofon.

Virtuális mikrofonok

Morfológia a különböző virtuális mikrofonminták között.

A B-formátumú komponensek kombinálásával virtuális mikrofonokat lehet készíteni bármilyen elsőrendű poláris mintával (körirányú, kardioid, hiperkardioid, nyolcadik szám vagy bármi közte), amely bármilyen irányba mutat. Egyidejűleg több ilyen, különböző paraméterekkel rendelkező mikrofon is származtatható, hogy egybeeső sztereó párokat (például Blumlein ) vagy térhatású tömböket hozzon létre .

Minta
Nyolcas ábra
Hiper- és szuperkardioidok
Kardioid
Széles kardioidok
Körirányú

A vízszintes virtuális mikrofont vízszintes szögben , mintával a

.

Ez a virtuális mikrofon szabad térben normalizált , ami azt jelenti, hogy állandó nyereséggel rendelkezik a tengelyes hangokhoz. A bal oldali illusztráció néhány példát mutat be ezzel a képlettel.

A virtuális mikrofonok manipulálhatók az utómunkálatok során: kiválaszthatók a kívánt hangok, elnyomhatók a nemkívánatosak, és a keverés során finomhangolható a közvetlen és visszhangzó hang közötti egyensúly.

Dekódolás

Naiv egysávos egyfázisú dekóder négyzet alakú hangszóró elrendezéshez.

Az alapvető Ambisonic dekódoló nagyon hasonlít a virtuális mikrofonok készletéhez. A tökéletesen szabályos elrendezéshez egyszerűsített dekódoló generálható, ha egy virtuális kardioid mikrofont az egyes hangszórók irányába mutat. Itt egy négyzet:

A és a komponensek jelei a fontos részek, a többi erősítési tényező. Az alkatrész elvetésre kerül, mivel nem lehetséges magassági jelzések reprodukálása mindössze négy hangszóróval egy síkban.

A gyakorlatban egy igazi Ambisonic dekódolónak számos pszichoakusztikus optimalizálásra van szüksége a megfelelő működéshez.

Magasabb rendű Ambisonics

Az Ambisonic B-formátumú komponensek vizuális megjelenítése akár harmadrendű. A sötét részek azokat a régiókat jelölik, ahol a polaritás megfordul. Figyelje meg, hogy az első két sor hogyan felel meg a mindenirányú és a nyolc számjegyű mikrofon poláris mintázatának.

Az elsőrendű Ambisonics fent leírt térbeli felbontása meglehetősen alacsony. A gyakorlatban ez kissé homályos forrásokat jelent, de összehasonlíthatóan kicsi használható hallgatási területet vagy édes helyet . A felbontás növelhető, és az édesség növelhető, ha szelektívebb irányú komponensek csoportjait adjuk hozzá a B-formátumhoz. Ezek már nem felelnek meg a hagyományos mikrofon poláris mintáinak, inkább lóherelevélnek néznek ki. A kapott jelet készlet majd az úgynevezett második , Harmadik- , vagy együttesen, Magasabb rendű Ambisonics .

Egy adott sorrendben a teljes gömbrendszerekhez jelkomponensekre van szükség , és a komponensek a vízszintes reprodukcióhoz szükségesek.

A magasabb rendű ambisonikáknak számos különböző formátumú konvenciója létezik; részletekért lásd: Ambisonic adatcsere formátumok .

Összehasonlítás más surround formátumokkal

Az Ambisonics számos szempontból különbözik a többi surround formátumtól:

  • Ez izotrop : hangok minden irányból egyenlően kezelik, szemben feltételezve, hogy a fő forrásai a hang elülső és a hátsó csatornák csak hangulatot vagy különleges hatásokat.
  • Az alapszintű vízszintes térhatáshoz csak három, a teljes körű hangzásképhez négy csatorna szükséges. Az alapvető teljes körű visszajátszáshoz legalább hat hangszóró szükséges (vízszintes esetén legalább négy).
  • Az Ambisonics jel leválasztva a lejátszási rendszerről: a hangszóró elhelyezése rugalmas (ésszerű határokon belül), és ugyanaz a programanyag dekódolható különböző számú hangszóróhoz. Ezenkívül a szélesség-magasság keverék lejátszható csak vízszintes, sztereó vagy akár monó rendszereken, anélkül, hogy teljesen elveszítené a tartalmat (a vízszintes síkra és a frontális negyedre lesz hajtogatva). Ez lehetővé teszi a gyártók számára, hogy az információvesztés miatt aggódni tudjanak a magas termelés mellett.
  • Az ambisonics tetszőleges térbeli felbontásra méretezhető további átviteli csatornák és több hangszóró árán a lejátszáshoz. A magasabb rendű anyagok továbbra is lefelé kompatibilisek, és kisebb térbeli felbontásban is lejátszhatók anélkül, hogy speciális lekeverést igényelnének.
  • Az Ambisonics alaptechnológiája szabadalmaktól mentes, és a teljes gyártási és hallgatási szerszámlánc ingyenes szoftverként elérhető minden nagyobb operációs rendszer számára .

A hátránya az Ambisonics:

  • Hajlamos a rendkívül instabil fantomforrásokra és a hangszórók reprodukciójának kis „édes pontjára” a prioritás hatása miatt .
  • Hajlamos erős színeződésre a fésűszűrő műtermékek miatt az időlegesen eltolt koherens hullámfrontok miatt, amikor hangszóró -tömbökön készülnek.
  • A minőségorientált hangmérnökök nem fogadják el a számtalan kísérlet és esetleges felhasználási eset ellenére, az 1970-es évek óta.
  • Gyakran félrevezető ábrázolásokkal forgalmazzák, amelyek nem felelnek meg a gyakorlati felhasználási eseteknek, például feltételezve egy szigorúan gömb alakú csatorna tömböt és egy hallgatót, amely pontosan a közepén ül, vagy korlátozó hullámmezős parcellákat egy kis frekvenciatartományban.
  • Egyik nagy lemezkiadó vagy médiavállalat sem támogatja. Bár számos Ambisonic UHJ formátumú (UHJ) kódolású (elsősorban klasszikus) szám megtalálható, ha némi nehézséggel is, de olyan szolgáltatásokon, mint a Spotify. [1] .
  • Elméletileg nehéz megérteni az embereket, szemben a hagyományos "egy csatorna, egy hangszóró" paradigmával.
  • A dekódolási szakasz miatt bonyolultabb a fogyasztó beállítása.

Elméleti alap

Hangmező elemzés (kódolás)

A B formátumú jelek a hangmező csonka gömbharmonikus felbontását tartalmazzák. Ezek megfelelnek a hangnyomásnak és a nyomásgradiens három összetevőjének (nem tévesztendő össze a kapcsolódó részecske sebességgel ) egy térbeli ponton. Ezek együttesen közelítik a hangteret a mikrofon körüli gömbön; formálisan a többpólusú bővítés elsőrendű csonka . (a mono jel) a nulla rendű információ, amely a gömb állandó függvényének felel meg, míg az elsőrendű kifejezések (a dipólusok vagy a nyolc számok). Ez az elsőrendű csonkítás csak hozzávetőleges a teljes hangzásképhez.

A magasabb rendek a szféra függvényének többpólusú bővítésének további feltételeinek felelnek meg a gömbharmonikusok tekintetében. A gyakorlatban a magasabb rendelések több hangszórót igényelnek a lejátszáshoz, de növelik a térbeli felbontást, és megnövelik azt a területet, ahol a hangmező tökéletesen reprodukálható (egy felső határfrekvenciáig).

Ennek a területnek a sugarát az ambisonikus rend és frekvencia szempontjából a

,

ahol a hangsebességet jelöli.

Ez a terület kisebb lesz, mint az emberi fej, 600 Hz fölött, első sorrendben, vagy 1800 Hz-nél, harmadrendben. A pontos reprodukció 20 kHz-es fejméretű hangerőben 32 vagy több mint 1000 hangszórót igényel.

Azokon a frekvenciák és hallgatási pozíciók, ahol a tökéletes hangzás rekonstrukció már nem lehetséges, Ambisonics sokszorosítást összpontosít, helyes irányú jelek, hogy a jó lokalizáció jelenlétében is rekonstrukció hibákat.

Pszichoakusztika

Az emberi hallókészülék nagyon élesen lokalizálódik a vízszintes síkon (néhány kísérletben olyan finom, mint a forrás 2 ° -os elválasztása). Két uralkodó jelzés azonosítható különböző frekvenciatartományokban:

Alacsony frekvenciájú lokalizáció

Alacsony frekvenciákon, ahol a hullámhossz nagy az emberi fejhez képest, egy bejövő hang diffrakál körülötte, így gyakorlatilag nincs akusztikus árnyék, és ezért nincs szintkülönbség a fülek között. Ebben a tartományban az egyetlen rendelkezésre álló információ a két füljel közötti fázisviszony, amelyet interakciós időkülönbségnek vagy ITD -nek neveznek . Ennek az időkülönbségnek az értékelése lehetővé teszi a pontos lokalizációt a zűrzavar kúpjában : a beesési szög egyértelmű, de az ITD ugyanaz az elülső vagy a hátsó hangok esetében. Mindaddig, amíg a hang nem teljesen ismeretlen az alany számára, a zavart rendszerint fel lehet oldani a fülcsapok (vagy a csúcsok ) által okozott timbralis elülső-hátsó variációk észlelésével .

Nagyfrekvenciás lokalizáció

Ahogy a hullámhossz megközelíti a fej kétszeresét, a fázisviszonyok kétértelművé válnak, mivel már nem világos, hogy a frekvencia növekedésével a fülek közötti fáziskülönbség egy, kettő vagy akár több periódusnak felel meg. Szerencsére a fej jelentős akusztikai árnyékot hoz létre ebben a tartományban, ami enyhe szintkülönbséget okoz a fülek között. Ezt hívják interakciós szintkülönbségnek vagy ILD -nek (ugyanaz a zűrzavar). Ez a két mechanizmus együttesen biztosítja a lokalizációt a teljes hallási tartományban.

ITD és ILD reprodukció az ambisonikában

Gerzon kimutatta, hogy a lokalizációs jelek minősége a reprodukált hangmezőben két objektív mérőszámnak felel meg: az ITD részecskesebesség -vektorának hossza és az ILD energiavektorának hossza . Gerzon és Barton (1992) határozza meg a dekódert vízszintes térhatású legyen Ambisonic ha

  • legalább 4 kHz -es irányok és megegyezés,
  • körülbelül 400 Hz alatti frekvenciákon, minden azimutszög esetén, és
  • frekvencián, körülbelül 700 Hz és 4 kHz, a nagysága van „lényegében maximális az egész, mint a nagy része a 360 ° hangteret, mint lehetséges” .

A gyakorlatban kielégítő eredményeket érnek el mérsékelt megrendelések esetén még nagyon nagy hallgatási területeken is.

Hangmező szintézis (dekódolás)

Elvileg a hangszóró jeleit az Ambisonic komponens jelek lineáris kombinációjának felhasználásával származtatják , ahol minden jel a hangszóró tényleges helyzetétől függ, egy képzeletbeli gömb középpontjához képest, amelynek felülete áthalad az összes rendelkezésre álló hangszórón. A gyakorlatban a hangszórók kissé szabálytalan távolsága késéssel kompenzálható .

Az igazi Ambisonics dekódoláshoz azonban szükség van a jelek térbeli kiegyenlítésére, hogy figyelembe vegyék az emberi hallás magas és alacsony frekvenciájú hang lokalizációs mechanizmusainak különbségeit . Egy további finomítás figyelembe veszi a hallgató távolságát a hangszóróktól ( közeli mező kompenzáció ).

Kompatibilitás a meglévő forgalmazási csatornákkal

Az Ambisonics dekódolókat jelenleg semmilyen jelentős módon nem forgalmazzák a végfelhasználóknak, és natív Ambisonic felvételek nem kaphatók kereskedelmi forgalomban. Ezért az Ambisonics -ban előállított tartalmat sztereó vagy diszkrét többcsatornás formátumban kell a fogyasztók rendelkezésére bocsátani.

Sztereó

Az Ambisonics tartalom automatikusan lehajtható sztereóvá, külön lekeverés nélkül. A legegyszerűbb módszer a B-formátum mintavételezése virtuális sztereó mikrofonnal . Az eredmény egybeeső sztereó felvétellel egyenértékű. A képalkotás a mikrofon geometriájától függ, de általában a hátsó források lágyabbak és szórtabbak lesznek. A függőleges információk (a csatornáról) kimaradnak.

Alternatív megoldásként a B-formátum mátrixkódolható UHJ formátumba , amely alkalmas sztereó rendszerek közvetlen lejátszására. Mint korábban, a függőleges információkat elvetik, de a bal-jobb reprodukció mellett az UHJ megpróbálja megtartani a vízszintes térhatású információk egy részét azáltal, hogy a hátsó forrásokat fázison kívüli jelekké fordítja le. Ez némi érzést ad a hallgatónak a hátsó lokalizációhoz.

A kétcsatornás UHJ vissza is dekódolható vízszintes Ambisonics-ba (némi pontosságvesztéssel), ha rendelkezésre áll Ambisonic lejátszási rendszer. Veszteségmentes UHJ akár négy csatorna létezik (beleértve a magassági információkat is), de soha nem látott széles körű használatot. Minden UHJ rendszerben az első két csatorna hagyományos bal és jobb hangszóró.

Többcsatornás formátumok

Hasonlóképpen manuális beavatkozás nélkül is lehetőség van az Ambisonics anyagok tetszőleges hangszóró-elrendezésre, például Quad , 5.1 , 7.1 , Auro 11.1 vagy akár 22.2 -re történő dekódolására . Az LFE csatorna kihagyásra kerül, vagy egy speciális keveréket hoz létre manuálisan. Az 5.1-es adathordozókra való előzetes dekódolást G-formátumként ismerték a DVD-hangzás kezdetén, bár ez a kifejezés már nem általánosan használt.

Az elődekódolás nyilvánvaló előnye, hogy bármely surround hallgató megtapasztalhatja az Ambisonics-ot; nincs szükség speciális hardverre a közös házimozi rendszerben találhatókon túl. A fő hátrány az, hogy az egyetlen, szabványos Ambisonics -jel bármely célhangszóró -tömbhöz történő megjelenítésének rugalmassága elvész: a jel egy speciális "szabványos" elrendezést feltételez, és bárki, aki más tömböt hallgat, a lokalizációs pontosság romlását tapasztalhatja.

Az 5.1-től felfelé irányuló célelrendezések általában meghaladják az elsőrendű Ambisonics térbeli felbontását, legalábbis a frontális negyedben. Az optimális felbontás, a túlzott áthallás elkerülése és a célelrendezés szabálytalanságainak elkerülése érdekében az ilyen célpontok előzetes dekódolását a magasabb rendű Ambisonics forrásanyagából kell levezetni.

Gyártási munkafolyamat

Az ambisonikus tartalom két alapvető módon hozható létre: hang felvételével megfelelő első vagy magasabb rendű mikrofonnal, vagy külön monofonikus források vétele és a kívánt pozíciókba pásztázása révén. A tartalom B-formátumban is kezelhető.

Ambisonikus mikrofonok

Natív B formátumú tömbök

A tömböt Dr. Jonathan Halliday, a Nimbus Records tervezte és készítette

Mivel az elsőrendű Ambisonics összetevői megfelelnek a fizikai mikrofonfelvételi mintáknak, teljesen praktikus a B-formátum közvetlen rögzítése, három egybeeső mikrofonnal: egy körirányú kapszula, egy előre néző 8-as számú kapszula és egy balra néző ábra -8 kapszula, így a , és a komponensek. Ezt nevezik natív vagy Nimbus/Halliday mikrofon tömbnek, a tervezője, Dr. Jonathan Halliday után a Nimbus Recordsnál , ahol széles körű és folyamatos Ambisonic kiadásaik sorozatát rögzítik. A beépített natív B-formátumú mikrofont, a C700S-t 1990 óta gyártja és értékesíti a Josephson Engineering .

Az ebben a megközelítésben rejlő elsődleges nehézség az, hogy a nagyfrekvenciás lokalizáció és tisztaság a valódi véletlenhez közeledő membránokra támaszkodik. A kapszulák függőleges egymásra rakásával tökéletes egybeesés érhető el a vízszintes forrásokhoz. A fentről vagy alulról érkező hang elméletileg azonban a legmagasabb frekvenciákon finom fésűszűrő hatásokat szenved. A legtöbb esetben ez nem korlátozás, mivel a vízszintes síktól távol eső hangforrások jellemzően a helyiségvisszhangból származnak. Ezenkívül a halmozott, 8. ábra szerinti mikrofon elemek halmozási tengelyük irányában mély nullával rendelkeznek, így az elsődleges jelátalakító ezekben az irányokban a központi, minden irányba vezető mikrofon. A gyakorlatban ez kevesebb lokalizációs hibát okozhat, mint bármelyik alternatíva (tetraéderes tömbök feldolgozással vagy egy negyedik mikrofon a Z tengelyhez).

A natív tömböket leggyakrabban csak vízszintes térhatású hangzáshoz használják, a negyedik mikrofon hozzáadásakor növekvő pozícióhibák és árnyékoló hatások miatt.

A tetraéderes mikrofon

Mivel lehetetlen tökéletesen egybeeső mikrofon tömböt felépíteni, a következő legjobb módszer a pozícióhiba lehető legkisebbre csökkentése és elosztása. Ezt úgy érhetjük el, hogy négy kardioid vagy szubkardioid kapszulát tetraéderbe helyezünk, és kiegyenlítjük az egyenletes diffúz mező válasz érdekében. A kapszulajeleket ezután mátrixművelettel B-formátumba konvertálják.

Az Ambisonicson kívül a tetraéderes mikrofonok népszerűvé váltak a sztereóban vagy 5.1-ben dolgozó helymeghatározó mérnökök körében, mivel rugalmasak az utómunkálatok során; itt a B-formátumot csak köztesként használják a virtuális mikrofonok levezetéséhez .

Magasabb rendű mikrofonok

Az elsőrendűek felett már nem lehetséges az Ambisonic komponensek közvetlen beszerzése egyetlen mikrofon kapszulával. Ehelyett a magasabb rendű különbségi jeleket több, térben elosztott (általában körirányú) kapszulából származtatják, nagyon kifinomult digitális jelfeldolgozással.

Az em32 Eigenmike egy kereskedelemben kapható, 32 csatornás, ambisonikus mikrofon.

Peter Craven et al. (később szabadalmaztatott) leírja a kétirányú kapszulák használatát a magasabb rendű mikrofonokhoz, hogy csökkentse a kiegyenlítés végső határát. Mikrofonokat még nem készítettek ezzel az ötlettel.

Ambisonikus pásztázás

Az önkényesen magas rendű Ambisonic keverékek előállításának legegyszerűbb módja, ha monofonikus forrásokat vesz fel, és Ambisonic kódolóval pozicionálja.

A teljes gömb kódolónak általában két paramétere van: azimut (vagy horizont) és magassági szög. A kódoló elosztja a forrásjelet az Ambisonic komponensekhez úgy, hogy dekódoláskor a forrás megjelenik a kívánt helyen. A kifinomultabb pannerek ezenkívül sugárparamétert is biztosítanak, amely gondoskodik a távolságfüggő csillapításról és a mélyhangkiemelésről a közeli mező hatása miatt.

Az elsőrendű Ambisonics hardverpásztázó egységei és keverői az 1980-as évek óta kaphatók, és kereskedelmi forgalomban is használatosak. Napjainkban a pásztázó beépülő modulok és más kapcsolódó szoftvereszközök elérhetők minden nagyobb digitális audio munkaállomáson, gyakran ingyenes szoftverként . Az önkényes buszszélesség -korlátozások miatt azonban kevés professzionális digitális audio munkaállomás (DAW) támogatja a másodiknál ​​magasabb megrendeléseket. Nevezetes kivételek a REAPER , a Pyramix , a ProTools , a Nuendo és az Ardor .

Ambisonikus manipuláció

Az elsőrendű B-formátum különböző módon manipulálható a hallási jelenet tartalmának megváltoztatásához. Jól ismert manipulációk közé tartozik a "forgatás" és a "dominancia" (a források mozgatása egy adott irányba vagy attól távol).

Ezenkívül a lineáris időinvariáns jelfeldolgozás, például a kiegyenlítés a B-formátumra is alkalmazható anélkül, hogy megzavarná a hangirányokat, feltéve, hogy minden komponenscsatornára egyformán vonatkozik.

Újabb fejlemények magasabb rendű Ambisonics lehetővé teszi a manipulációk széles skáláját, beleértve a forgatást, a tükröződést, a mozgást, a 3D reverb-et , a régebbi formátumokból, például az 5.1 vagy az első sorrendből, a vizualizációt és az irányfüggő maszkolást és kiegyenlítést.

Adatcsere

Az Ambisonic B-formátum továbbítása az eszközök és a végfelhasználók között szabványosított csereformátumot igényel. Míg a hagyományos elsőrendű B-formátum jól definiált és általánosan érthető, a magasabb rendű ambisonikáknak ellentmondó konvenciói vannak, amelyek mind a csatorna sorrendjében, mind a súlyozásban különböznek, és amelyeket egy ideig támogatni kell. Hagyományosan a legelterjedtebb a Furse-Malham magasabb rendű formátum a .ambtárolóban, a Microsoft WAVE-EX fájlformátuma alapján. Harmadik sorrendig terjed, és a fájlméret korlátozása 4 GB.

Az új megvalósítások és gyártások érdemes fontolóra venni az AmbiX javaslatot, amely elfogadja a .caffájlformátumot, és megszünteti a 4 GB -os korlátot. Önkényesen magas megrendelésekre méretezhető, és SN3D kódoláson alapul. A Google elfogadta az SN3D kódolást YouTube 360 ​​formátumának alapjául.

Jelenlegi fejlemény

Nyílt forráskód

2018 óta ingyenes és nyílt forráskódú megvalósítás létezik az Opus hangkodekben .

Vállalati érdeklődés

Amióta a Google és más gyártók elfogadták a virtuális valóság választott hangformátumaként , az Ambisonics érdeklődése megugrott.

2018 -ban a Sennheiser kiadta VR -mikrofonját , a Zoom pedig egy Ambisonics Field Recorder -t. Mindkettő a tetraéderes mikrofon kialakításának megvalósítása, amely elsőrendű Ambisonics -et gyárt.

Számos vállalat jelenleg kutatásokat végez az Ambisonics területén:

A Dolby Laboratories "érdeklődését" fejezte ki az Ambisonics iránt azzal, hogy megvásárolta (és felszámolta) a barcelonai székhelyű Ambisonics special imm hangot a Dolby Atmos bevezetése előtt , amely, bár pontos működése nem ismert, megvalósítja a forrásirány és a hangszóró tényleges pozíciói közötti leválasztást. Az Atmos alapvetően más megközelítést alkalmaz abban az értelemben, hogy nem kísérel meg hangteret továbbítani; diszkrét előkeverékeket vagy szárakat (azaz nyers hangadatfolyamokat) továbbít metaadatokkal együtt arról, hogy milyen helyről és irányból kell megjelenniük. A szárakat ezután dekódolják, összekeverik és valós időben renderelik a lejátszási helyen elérhető hangszórók segítségével.

Használja a játékban

A magasabb rendű Ambisonics piaci rést talált a Codemasters által kifejlesztett videojátékokban . Az első játékuk, amelyben Ambisonic hangmotort használtak, a Colin McRae: DiRT volt , azonban ez csak az PlayStation 3 platformon használt Ambisonics -t használta . A Race Driver: GRID játékuk kiterjesztette az Ambisonics használatát az Xbox 360 platformra, a Colin McRae: DiRT 2 pedig az Ambisonics -t használja minden platformon, beleértve a PC -t is.

A legújabb játékok Codemasters, F1 2010 , Dirt 3 , F1 2011 és Dirt: Showdown használja negyedrendű Ambisonics gyorsabb számítógépek, által nyújtott Blue Ripple Sound 's Rapture3D OpenAL vezető és előre kevert Ambisonic audio felhasználásával előállított Bruce Wiggins' WigWare Ambisonic plug-inek.

Az OpenAL Soft [2] , az OpenAL specifikáció ingyenes és nyílt forráskódú megvalósítása, szintén az Ambisonics programot használja a 3D hang előállításához. Az OpenAL Soft gyakran helyettesíthető más OpenAL-implementációkhoz, lehetővé téve számos, az OpenAL API-t használó játék számára, hogy részesüljenek az Ambisonics hanglejátszásából.

Sok olyan játék esetében, amelyek nem használják az OpenAL API -t natív módon, egy csomagoló vagy csomagoló lánc használata segíthet abban, hogy ezek a játékok közvetve az OpenAL API -t használják. Ez végső soron ahhoz vezet, hogy a hangot az Ambisonics szolgáltatja, ha egy alkalmas OpenAL illesztőprogramot, például OpenAL Soft -t használnak.


Szabadalmak és védjegyek

Az Ambisonic fejlesztésekre vonatkozó szabadalmak többsége lejárt (beleértve a Soundfield mikrofont is ), és ennek eredményeként az alaptechnológia mindenki számára elérhető. Ez alól kivételt képez Dr. Geoffrey Barton Trifield technológiája, amely egy három hangszórós sztereó renderelő rendszer, amely az Ambisonic elméleten alapul ( US 5594800  ), valamint az úgynevezett "bécsi" dekódolók, amelyek Gerzon és Barton 1992-es bécsi AES papírja alapján készültek. szabálytalan hangszórótömbök dekódolására ( US 5757927  ).

Az Ambisonics technológiát tartalmazó szabadalmak "gyűjteményét" eredetileg az Egyesült Királyság kormányának Nemzeti Kutatási és Fejlesztési Társaság (NRDC) állította össze, amely az 1970 -es évek végéig létezett, hogy kifejlessze és népszerűsítse a brit találmányokat, és engedélyezze azokat a kereskedelmi gyártóknak - ideális esetben egyetlen engedélyes számára. A rendszer végső soron a Nimbus Records (jelenleg a Wyastone Estate Ltd tulajdonában van) licencével rendelkezik.

Az "összekapcsolódó körök" Ambisonic logója (az Egyesült Királyság védjegyei: UK00001113276 és UK00001113277 ), valamint az "AMBISONIC" és az "AMBISO N" (az Egyesült Királyság UK00001500177 és UK00001112259 védjegyei ), amelyek korábban a Wyastone Estate Ltd. tulajdonában voltak, 2010 -től lejártak.

Lásd még

Megjegyzések

Hivatkozások

Külső linkek