DeepDream - DeepDream

"Mona Lisa" DeepDream effektussal, az ImageNeten betanított VGG16 hálózat használatával

DeepDream egy számítógépes látás program által létrehozott Google mérnök Alexander Mordvintsev, amely egy konvolúciós neurális hálózat megtalálni és fokozza minták képek segítségével algoritmikus pareidolia , ezáltal egy álom -szerű pszichedelikus megjelenése a szándékosan túlzott feldolgozott képeket.

A Google programja népszerűsítette a (mély) "álmodozás" kifejezést, hogy olyan képeket generáljon, amelyek a kívánt aktiválást eredményezik egy képzett mélyhálózatban , és a kifejezés most a kapcsolódó megközelítések gyűjteményére utal.

Történelem

A DeepDream szoftvert, amely az azonos nevű film után "Inception" kódnevű mély konvolúciós hálózatból származik, az ImageNet Large-Scale Visual Recognition Challenge (ILSVRC) számára fejlesztették ki 2014-ben, és 2015 júliusában adták ki.

Az álmodozó ötlet és név 2015 -ben vált népszerűvé az interneten a Google DeepDream programjának köszönhetően. Az ötlet a neurális hálózatok történetének korai szakaszából származik, és hasonló módszereket alkalmaztak a vizuális textúrák szintetizálására. A kapcsolódó vizualizációs ötleteket (a Google munkáját megelőzően) több kutatócsoport dolgozta ki.

Miután a Google közzétette technikáikat és kódjukat nyílt forráskódúvá tette , számos olyan eszköz jelent meg webes szolgáltatások, mobilalkalmazások és asztali szoftverek formájában, amelyek lehetővé tették a felhasználók számára, hogy saját fotóikat átalakítsák.

Folyamat

A medúza képe kék alapon
Tíz ismétlés után a DeepDream segítségével feldolgozott medúza képe
A DeepDream által feldolgozott medúza képe ötven iteráció után
Az eredeti kép (felül) a DeepDream tíz (középső) és ötven (alsó) iterációjának alkalmazása után, a hálózatot kutyák észlelésére képezték ki

A szoftver célja az arcok és más minták észlelése a képeken, a képek automatikus osztályozása céljából. Azonban a képzést követően a hálózat fordított irányban is futtatható, és megkérik, hogy kissé állítsa be az eredeti képet, hogy egy adott kimeneti idegsejt (pl. Az arcok vagy bizonyos állatoké) magasabb megbízhatósági pontszámot adjon. Ez használható vizualizációkhoz, hogy jobban megértse a neurális hálózat kialakuló struktúráját, és ez a DeepDream koncepció alapja. Ez a visszafordítási eljárás soha nem teljesen világos és egyértelmű, mert egy-egy-sok leképezési eljárást alkalmaz. Azonban elegendő ismétlés után még a keresett jellemzőktől mentes képeket is kellően kiigazítják ahhoz, hogy a Pareidolia egy formája létrejöjjön , amellyel pszichedelikus és szürreális képeket hoznak létre algoritmikusan. Az optimalizálás hasonlít a visszamenőleges terjesztésre , azonban a hálózati súlyok beállítása helyett a súlyokat rögzítve tartják, és a bemenetet módosítják.

Például egy meglévő kép megváltoztatható úgy, hogy "macskaszerűbb" legyen, és az így kapott továbbfejlesztett kép ismét bevihető az eljárásba. Ez a használat hasonlít az állatok vagy más minták felhőkben történő keresésére.

Ha a bemenet minden képpontjától függetlenül alkalmazunk gradiens -süllyedést, olyan képeket kapunk, amelyekben a szomszédos képpontok kevés összefüggésben vannak, és így a kép túl sok nagyfrekvenciás információt tartalmaz. A létrehozott képek nagymértékben javíthatók, ha olyan előzetes vagy szabályozó eszközt tartalmaznak, amely előnyben részesíti azokat a bemeneteket, amelyek természetes képstatisztikával rendelkeznek (minden egyes kép előnyben részesítése nélkül), vagy egyszerűen simaak. Például Mahendran és mtsai. a teljes variációszabályozót használta, amely a darabonként állandó képeket részesíti előnyben. A különböző regulátorokat a továbbiakban tárgyaljuk. A funkciók vizualizációs és rendszeresítési technikáinak mélyreható, vizuális feltárása jelent meg a közelmúltban.

A képek idézett hasonlósága az LSD - és a psilocibin által kiváltott hallucinációkhoz funkcionális hasonlóságra utal a mesterséges ideghálózatok és a vizuális kéreg egyes rétegei között.

A Computerphile számítástechnikai műsor részletesen leírja a Google Dream által használt gépi tanulási folyamatokat.

Használat

Erősen DeepDream által feldolgozott fénykép három férfiról a medencében

Az álmodozó ötlet a kimeneten kívül más rejtett (belső) idegsejtekre is alkalmazható, ami lehetővé teszi a hálózat különböző részeinek szerepeinek és ábrázolásainak feltárását. Lehetőség van a bemenet optimalizálására akár egyetlen idegsejt kielégítésére (ezt a felhasználást néha Activity Maximization-nek hívják), akár egy teljes neuronréteg kielégítésére.

Míg az álmodozást leggyakrabban hálózatok vizualizálására vagy számítógépes művészet előállítására használják, a közelmúltban felmerült az a javaslat, hogy az "álmodott" bemenetek hozzáadása a képzési készlethez javíthatja a számítástechnikai absztrakciók képzési idejét.

A DeepDream modellről bebizonyosodott, hogy a művészettörténet területén is alkalmazható .

A DeepDream a Foster the People videoklipjéhez készült a "Doing It for the Money" című dalhoz.

2017-ben a sussexi egyetem kutatócsoportja létrehozott egy hallucinációs gépet , amely a DeepDream algoritmust alkalmazta egy előre felvett panorámás videóra, lehetővé téve a felhasználók számára, hogy felfedezzék a virtuális valóság környezeteit, hogy utánozzák a pszichoaktív anyagok tapasztalatait és / vagy a pszichopatológiai állapotokat. Képesek voltak bizonyítani, hogy a hallucinációs gép által kiváltott szubjektív élmények jelentősen különböznek a kontroll (nem „hallucinogén”) videóktól, miközben fenomenológiai hasonlóságokat mutatnak a pszichedelikus állapothoz (a psilocibin beadását követően).

Lásd még

Hivatkozások

Külső linkek