Nash egyensúly - Nash equilibrium

Nash egyensúly
A megoldási koncepció a játékelmélet
Kapcsolat
Részhalmaza Racionalizálhatóság , Epsilon-egyensúly , Korrelációs egyensúly
Superset of Evolúciósan stabil stratégia , subgame tökéletes egyensúly , Perfect Bayes-egyensúly , remegő kézzel tökéletes egyensúly , stabil Nash-egyensúly , Erős Nash-egyensúly , Cournot- egyensúlyi
Jelentőség
Által javasolt John Forbes Nash Jr.
Használt Minden nem együttműködő játék

A játékelmélet , a Nash-egyensúly , melynek névadója a matematikus John Forbes Nash Jr. , a leggyakoribb módja, hogy meghatározzák a megoldás egy nem kooperatív játék , amely két vagy több játékos. A Nash -egyensúlyban feltételezzük, hogy minden játékos ismeri a többi játékos egyensúlyi stratégiáját, és egyetlen játékosnak sincs nyeresége, ha csak saját stratégiáját változtatja meg. A Nash -egyensúly elve Cournot idejéből származik , aki a kimeneteket választó versenytárs cégeknél alkalmazta.

Ha minden játékos kiválasztott egy stratégiát - egy cselekvési tervet, amely a saját cselekedeteit választja a játékban eddig történtek alapján -, és egyik játékos sem tudja növelni saját várható hozamát, ha megváltoztatja stratégiáját, míg a többi játékos változatlanul tartja a sajátját, akkor a jelenlegi A stratégiaválasztások halmaza Nash -egyensúlyt jelent.

Ha két játékos, Alice és Bob az A és a B stratégiát választja, (A, B) Nash -egyensúly, ha Alice -nek nincs más stratégiája, amely A -nál jobban teljesítene a fizetésének maximalizálásában, ha Bob a B -t választja, és Bobnak nincs más stratégiája elérhető, amely jobban teljesít, mint B, és maximalizálja a nyereségét, amikor Alice az A -t választotta. Egy olyan játékban, amelyben Carol és Dan is játékos, (A, B, C, D) Nash -egyensúly, ha A Alice legjobb válasza a ( B, C, D), B Bob legjobb válasza (A, C, D), és így tovább.

Nash megmutatta, hogy minden véges játékban van Nash -egyensúly: lásd tovább a stratégiáról szóló cikket .

Alkalmazások

A játékelmélettel foglalkozó szakemberek a Nash -egyensúly segítségével elemzik több döntéshozó stratégiai interakciójának eredményét . A stratégiai interakció során az egyes döntéshozók eredménye a többiek és saját döntéseik függvénye. Nash ötlete mögött meghúzódó egyszerű meglátás az, hogy nem lehet előre megjósolni több döntéshozó döntését, ha ezeket a döntéseket elszigetelten elemzi. Ehelyett meg kell kérdezni, hogy minden játékos mit tenne, figyelembe véve, hogy mit vár el a többiektől. A Nash -egyensúly megköveteli, hogy a döntéseik következetesek legyenek: egyik játékos sem akarja visszavonni döntését, tekintettel arra, amit a többiek döntenek.

A koncepciót olyan ellenséges helyzetek elemzésére használták, mint a háborúk és a fegyverkezési versenyek (lásd a fogolydilemmát ), valamint azt is, hogyan lehet a konfliktust mérsékelni az ismételt interakcióval (lásd tit-for-tat ). Azt is tanulmányozták, hogy a különböző preferenciákkal rendelkező emberek mennyiben tudnak együttműködni (lásd a nemek csatáját ), és vállalnak -e kockázatot az együttműködési eredmény elérése érdekében (lásd a szarvasvadászatot ). Arra használták, hogy tanulmányozzák elfogadása technikai standardok , valamint az esemény a bank fut és valutaválság (lásd koordinációs játék ). Egyéb alkalmazások közé tartozik a forgalom áramlása (lásd Wardrop elvét ), az aukciók megszervezésének módja (lásd aukciós elmélet ), az oktatási folyamatban részt vevő több fél által tett erőfeszítések eredménye, a szabályozási jogszabályok, például a környezetvédelmi előírások (lásd a közös tragédia ), a természeti erőforrások menedzsment, marketingstratégiák elemzése, sőt büntetőrúgások a futballban (lásd a megfelelő fillérekért ), energiarendszerek, közlekedési rendszerek, evakuálási problémák és vezeték nélküli kommunikáció.

Történelem

A Nash -egyensúlyt John Forbes amerikai matematikusról nevezték el, ifjabb . Ugyanezt a gondolatot használta egy adott alkalmazásban 1838 -ban Antoine Augustin Cournot oligopólium -elméletében . Cournot elmélete szerint több vállalat mindegyike kiválasztja, hogy mennyi termelést termel, hogy maximalizálja profitját. Az egyik cég legjobb teljesítménye a többi vállalat teljesítményétől függ. A Cournot-egyensúly akkor következik be, amikor minden cég kibocsátása maximalizálja nyereségét, figyelembe véve a többi cég kibocsátását, ami tiszta stratégia Nash-egyensúly. Cournot az egyensúly stabilitásának elemzésekor bevezette a legjobb válaszdinamika fogalmát is . Cournot azonban nem használta az ötletet más alkalmazásokban, és nem is határozta meg általánosságban.

A Nash -egyensúly modern fogalmát ehelyett vegyes stratégiák határozzák meg , ahol a játékosok a valószínűségi eloszlást választják a lehetséges tiszta stratégiák helyett (ami a valószínűség 100% -át egyetlen tiszta stratégiára helyezheti; az ilyen tiszta stratégiák a vegyes stratégiák részhalmaza). A vegyes stratégiájú egyensúly fogalmát John von Neumann és Oskar Morgenstern vezették be 1944-ben, The Theory of Games and Economic Behavior című könyvükben , de elemzésük a nullaösszegű játékok különleges esetére korlátozódott . Megmutatták, hogy vegyes stratégiájú Nash-egyensúly létezik minden véges cselekvést tartalmazó nullaösszegű játék esetén. Nash 1951-es „Nem együttműködési játékok” című cikkében az volt a feladata, hogy meghatározzon egy vegyes stratégiájú Nash-egyensúlyt minden véges cselekvést tartalmazó játékhoz, és bizonyítsa, hogy legalább egy (vegyes stratégiájú) Nash-egyensúlynak léteznie kell egy ilyen játszma, meccs. Nash azon képessége, hogy von Neumannnál jóval általánosabban tudja bizonyítani a létezését, az egyensúly meghatározásában rejlik. Nash szerint "az egyensúlyi pont olyan n-tuple, hogy minden játékos vegyes stratégiája maximalizálja a nyereségét, ha a többiek stratégiáit rögzítve tartjuk. Így minden játékos stratégiája optimális a többiek stratégiájával szemben." A probléma ebbe a keretbe foglalása lehetővé tette Nash számára , hogy 1950-ben megjelent dolgozatában a Kakutani fixpontos tételt alkalmazza az egyensúly fennállásának bizonyítására. 1951-es dolgozata ugyanebből a célból használta az egyszerűbb Brouwer fixpontos tételt .

A játékelméleti kutatók felfedezték, hogy bizonyos körülmények között a Nash -egyensúly érvénytelen jóslatokat tesz, vagy nem tesz egyedülálló előrejelzést. Számos megoldási koncepciót javasoltak (a Nash -egyensúlyok „finomítását”), amelyek célja az valószínűtlen Nash -egyensúlyok kizárása. Az egyik különösen fontos kérdés az, hogy bizonyos Nash -egyensúlyok olyan fenyegetéseken alapulhatnak, amelyek nem „ hitelesek ”. 1965-ben Reinhard Selten azt javasolta, hogy az aljáték tökéletes egyensúlya finomításként megszüntesse a nem hiteles fenyegetéseken alapuló egyensúlyokat . A Nash egyensúlyi koncepció más kiterjesztései foglalkoztak azzal, hogy mi történik, ha egy játék megismétlődik , vagy mi történik, ha a játékot teljes információ hiányában játsszák . A Nash -egyensúly későbbi finomításai és kiterjesztései azonban megosztják a fő meglátást, amelyen Nash koncepciója nyugszik: az egyensúly olyan stratégiák halmaza, amelyek alapján minden játékos stratégiája optimális a többiek választása alapján.

Definíciók

Nash egyensúly

A stratégiaprofil stratégiák halmaza, minden játékosnak egy. Informálisan a stratégiaprofil Nash -egyensúly, ha egyetlen játékos sem tud jobban teljesíteni, ha egyoldalúan megváltoztatja stratégiáját. Hogy megértsük, mit jelent ez, képzelje el, hogy minden játékosnak elmondják a többiek stratégiáját. Tegyük fel, hogy akkor minden játékos megkérdezi magától: "Ismerve a többi játékos stratégiáját, és kezelve a többi játékos stratégiáját kőbe vésettként, profitálhatok a stratégiám megváltoztatásából?"

Ha bármelyik játékos igennel válaszolhat, akkor ez a stratégia nem Nash -egyensúly. De ha minden játékos inkább nem vált (vagy közömbös a váltás és nem között), akkor a stratégiaprofil Nash -egyensúly. Így minden Nash -egyensúlyi stratégia a legjobb válasz a többi játékos stratégiájára ebben az egyensúlyban.

Formálisan, legyen a készlet minden lehetséges stratégia játékos , ahol . Legyen egy stratégiaprofil, egy halmaz, amely minden játékos számára egy stratégiából áll, ahol az összes játékos stratégiáját jelöli, kivéve . Legyen az i játékos kifizetése a stratégiák függvényében. A stratégiaprofil Nash -egyensúly, ha

Egy játéknak több Nash egyensúlya is lehet. Még ha az egyensúly egyedi is, gyenge lehet : a játékos közömbös lehet több stratégia között, tekintettel a többi játékos választására. Egyedülálló, és szigorú Nash -egyensúlynak nevezik, ha az egyenlőtlenség szigorú, így az egyik stratégia az egyedülálló legjobb válasz:

Vegye figyelembe, hogy a stratégiakészlet különböző lehet a különböző játékosok számára, és elemei különböző matematikai objektumok lehetnek. Legegyszerűbben a játékos lehet választani a két stratégiát, például Vagy a stratégia halmaz lehet egy véges halmaza feltételes stratégiák válaszol a többi játékos, pl Vagy lehet, hogy végtelen sok, a folytonosság vagy határtalan, pl úgy, hogy egy nem negatív valós szám. Nash létezési bizonyítékai véges stratégia -készletet feltételeznek, de a Nash -egyensúly fogalma ezt nem írja elő.

A Nash-egyensúly néha nem racionálisnak tűnik harmadik személy szemszögéből. Ez azért van, mert a Nash -egyensúly nem feltétlenül Pareto -optimális .

A Nash egyensúlynak nem racionális következményei is lehetnek a szekvenciális játékokban, mert a játékosok "megfenyegethetik" egymást olyan fenyegetésekkel, amelyeket valójában nem hajtanak végre. Az ilyen játékoknál az aljáték tökéletes Nash -egyensúlya jelentősebb lehet elemzési eszközként.

Szigorú/gyenge egyensúly

Tegyük fel, hogy a Nash -egyensúlyban minden játékos megkérdezi magától: "Ismerve a többi játékos stratégiáját, és a többi játékos stratégiáját kőbe vésve, veszteséget szenvednék -e a stratégiám megváltoztatásával?"

Ha minden játékos válasza "Igen", akkor az egyensúly szigorú Nash -egyensúlynak minősül .

Ha ehelyett bizonyos játékosok esetében pontos egyenlőség áll fenn a Nash -egyensúlyi stratégia és más, pontosan ugyanazt a kifizetést biztosító stratégia között (azaz ez a játékos közömbös a váltás és nem között), akkor az egyensúlyt gyenge Nash -egyensúlynak minősítik .

A játéknak lehet tiszta vagy vegyes stratégiájú Nash-egyensúlya. (Ez utóbbiban a tiszta stratégiát sztochasztikusan választják , fix valószínűséggel ).

Nash létezési tétele

Nash bebizonyította, hogy ha megengedettek a vegyes stratégiák (ahol a játékos kiválasztja a különböző tiszta stratégiák alkalmazásának valószínűségét), akkor minden véges számú játékkal rendelkező játéknak, amelyben minden játékos választhat a véges sok tiszta stratégia közül, legalább egy Nash -egyensúlya van, ami tiszta stratégia lehet minden játékos számára, vagy valószínűségi eloszlás lehet minden játékos stratégiái között.

A Nash-egyensúlynak nem kell léteznie, ha a lehetőségek halmaza végtelen és nem kompakt. Példa erre egy olyan játék, ahol két játékos egyszerre nevez meg egy számot, és a nagyobb számot megnevező játékos nyer. Egy másik példa az, hogy két játékos mindegyike valódi számot választ 5 -nél szigorúbban, és az nyer, akinek a legnagyobb a száma; nem létezik szigorúan 5 -nél kisebb szám (ha a szám megegyezik az 5 -tel, akkor a Nash -egyensúlyban mindkét játékos 5 -öt választ, és megköti a játékot). Nash -egyensúly azonban fennáll, ha a választási lehetőségek kompaktak, és minden játékos stratégiája folyamatos, minden játékos stratégiájában.

Példák

Koordinációs játék

Egy koordinációs játék, amely az 1. játékos (sor) \ 2. játékos (oszlop) kifizetését mutatja
Játékos 1 stratégia Játékos 2 stratégia
A 2. játékos elfogadja az A stratégiát A 2. játékos elfogadja a B stratégiát
Az 1. játékos elfogadja az A stratégiát
4
4
3
1
Az 1. játékos elfogadja a B stratégiát
1
3
2
2

A koordinációs játék egy klasszikus két játékosból álló, két stratégiai játék, amint azt a jobb oldalon látható kifizetési mátrix mutatja . Két tiszta stratégia egyensúly létezik: (A, A), mindegyik játékos 4-es, (B, B) pedig 2-es. A kombináció (B, B) Nash -egyensúly, mert ha bármelyik játékos egyoldalúan megváltoztatja stratégiáját B -ről A -ra, akkor a nyereménye 2 -ről 1 -re csökken.

A koordinációs játék híres példája a szarvasvadászat . Két játékos dönthet úgy, hogy szarvasra vagy nyúlra vadászik, a szarvas több húst biztosít (4 használati egység, 2 játékosnak), mint a nyúl (1 használati egység). A figyelmeztetés az, hogy a szarvasbikákat közösen kell vadászni, tehát ha az egyik játékos megpróbálja vadászni a szarvasra, míg a másik vadászik a nyúlra, a szarvasvadász teljesen kudarcot vall, 0 nyereményért, míg a nyúlvadásznak sikerül a nyeremény 1. A játéknak két egyensúlya van, (szarvas, szarvas) és (nyúl, nyúl), mert a játékos optimális stratégiája attól függ, hogy elvárja, mit fog tenni a másik játékos. Ha az egyik vadász bízik abban, hogy a másik vadászik a szarvasra, akkor vadásznia kell a szarvasra; ha azonban úgy gondolja, hogy a másik vadászni fog a nyúlra, ő is vadászni fog a nyúlra. Ezt a játékot a társadalmi együttműködés analógiájaként használják, mivel az emberek által a társadalomban elért előnyök nagy része attól függ, hogy az emberek együttműködnek -e, és hallgatólagosan bíznak -e egymásban az együttműködésnek megfelelő módon.

Koordinációs játék az is, ha az úton közeledik a szembejövő autó ellen, és választania kell, hogy balra vagy jobbra kanyarodik. Például, ha a 10 kifizetés azt jelenti, hogy nincs összeomlás, a 0 pedig az összeomlást, a koordinációs játék a következő kifizetési mátrix segítségével határozható meg:

A vezetési játék
Játékos 1 stratégia Játékos 2 stratégia
Hajtson balra Hajtson jobbra
Hajtson balra
10
10
0
0
Hajtson jobbra
0
0
10
10

Ebben az esetben két tiszta stratégiájú Nash-egyensúly létezik, amikor mindketten a bal vagy a jobb oldali vezetést választják. Ha elismerjük a vegyes stratégiákat (ahol a tiszta stratégiát véletlenszerűen választják ki, bizonyos rögzített valószínűség függvényében), akkor három Nash-egyensúly létezik ugyanarra az esetre: kettő, amit a tiszta stratégia űrlapból láthattunk, ahol a valószínűségek (0 %, 100%) az első játékosnál, (0%, 100%) a második játékosnál; és (100%, 0%) az első játékosnál, (100%, 0%) a második játékosnál. Hozzáadunk egy másikat, ahol minden játékos valószínűsége (50%, 50%).

Hálózati forgalom

Minta hálózati grafikon. A széleken szereplő értékek azt az utazási időt jelentik, amelyet egy „autó” tapasztalt lefelé. x az élen haladó autók száma.

A Nash -egyensúly alkalmazása a hálózat forgalmának várható áramlását határozza meg. Tekintsük a jobb oldali grafikont. Ha feltételezzük, hogy x "autó" utazik A -ból D -be, akkor mi a forgalom várható eloszlása ​​a hálózatban?

Ez a helyzet „játékként” modellezhető, ahol minden utazó 3 stratégia közül választhat, ahol minden stratégia egy útvonal A -tól D -ig (az ABD , ABCD vagy ACD egyik útja ). Az egyes stratégiák "megtérülése" az egyes útvonalak utazási ideje. A jobb oldali grafikonon az ABD -n keresztül utazó autó (1+ x /100) +2 utazási időt tapasztal , ahol x az AB szélén haladó autók száma . Így az adott stratégia kifizetése a többi játékos döntéseitől függ, mint általában. A cél azonban ebben az esetben az utazási idő minimalizálása, nem pedig maximalizálása. Az egyensúly akkor következik be, ha az összes útvonal ideje pontosan azonos. Amikor ez megtörténik, egyetlen sofőr sem ösztönzi az útvonalváltást, mivel ez csak növeli az utazási időt. A jobb oldali grafikon esetében, ha például 100 autó utazik A -ból D -be, akkor az egyensúly akkor következik be, amikor 25 vezető az ABD -n , 50 az ABCD -n és 25 az ACD -n keresztül utazik . Most minden sofőr utazási ideje 3,75 (ennek megtekintéséhez vegye figyelembe, hogy összesen 75 autó veszi az AB élét, és hasonlóképpen 75 autó veszi a CD élét).

Vegye figyelembe, hogy ez az eloszlás valójában nem társadalmilag optimális. Ha a 100 autó egyetért abban, hogy 50 az ABD -n , a másik 50 pedig az ACD -n keresztül utazik, akkor bármelyik autó utazási ideje valójában 3,5 lenne, ami kevesebb, mint 3,75. Ez a Nash -egyensúly is, ha megszűnik a B és C közötti út, ami azt jelenti, hogy egy másik lehetséges útvonal hozzáadása csökkentheti a rendszer hatékonyságát, ami Braess paradoxona néven ismert jelenség .

Verseny játék

Versenyjáték
Játékos 1 stratégia Játékos 2 stratégia
Válassza a "0" lehetőséget Válassza az "1" lehetőséget Válassza a "2" lehetőséget Válassza a "3" lehetőséget
Válassza a "0" lehetőséget 0 , 0 2 , -2 2 , -2 2 , -2
Válassza az "1" lehetőséget -2 , 2 1 , 1 3 , -1 3 , -1
Válassza a "2" lehetőséget -2 , 2 -1 , 3 2 , 2 4 , 0
Válassza a "3" lehetőséget -2 , 2 -1 , 3 0 , 4 3 , 3

Ezt szemléltetheti egy kétjátékos játék, amelyben mindkét játékos egyszerre választ egy egész számot 0-tól 3-ig, és mindketten a két szám közül a kisebbet nyerik pontban. Ezenkívül, ha az egyik játékos nagyobb számot választ, mint a másik, akkor két pontot kell feladnia a másiknak.

Ez a játék egyedülálló, tiszta stratégiájú Nash-egyensúllyal rendelkezik: mindkét játékos 0-t választ (világos piros színnel kiemelve). Bármely más stratégia javítható, ha egy játékos eggyel kevesebbre váltja a számát, mint a másik játékosé. Ha a szomszédos asztalnál a játék a zöld négyzetnél kezdődik, az 1. játékos érdeke, hogy a lila négyzetre lépjen, és a 2. játékos érdeke, hogy a kék négyzetre lépjen. Bár nem illeszkedik a versenyjáték definíciójához, ha a játékot úgy módosítják, hogy a két játékos megnyeri a megnevezett összeget, ha mindketten ugyanazt a számot választják, és egyébként semmit sem nyernek, akkor 4 Nash -egyensúly van: (0,0 ), (1,1), (2,2) és (3,3).

Nash -egyensúly a kifizetési mátrixban

Van egy egyszerű numerikus módszer a Nash -egyensúlyok azonosítására a kifizetési mátrixon. Különösen hasznos a kétszemélyes játékokban, ahol a játékosoknak több mint két stratégiájuk van. Ebben az esetben a formális elemzés túl hosszúra nyúlhat. Ez a szabály nem vonatkozik arra az esetre, amikor a vegyes (sztochasztikus) stratégiák érdekesek. A szabály a következő: ha az első kifizetési szám a cella kifizetési párjában a cella oszlopának maximális értéke, és ha a második szám a cella sorának maximális értéke, akkor a cella Nash -t képvisel egyensúlyi.

Kifizetési mátrix - Nash -egyensúly vastag betűvel
Játékos 1 stratégia Játékos 2 stratégia
A lehetőség B lehetőség C. lehetőség
A lehetőség 0, 0 25, 40 5, 10
B lehetőség 40, 25 0, 0 5, 15
C. lehetőség 10, 5 15, 5 10, 10

Ezt a szabályt alkalmazhatjuk egy 3 × 3 mátrixra:

A szabályt alkalmazva nagyon gyorsan (sokkal gyorsabban, mint a formális elemzésnél) láthatjuk, hogy a Nash -egyensúlyi sejtek (B, A), (A, B) és (C, C). Valójában a (B, A) cella esetében 40 az első oszlop maximális értéke, 25 pedig a második sor maximális értéke. (A, B) esetén 25 a második oszlop maximális értéke, 40 pedig az első sor maximális értéke. Ugyanez vonatkozik a cellára (C, C). Más cellák esetében az egyik vagy mindkét kettős tag nem a megfelelő sorok és oszlopok maximális értéke.

Ez azt jelenti, hogy az egyensúlyi cellák megtalálásának tényleges mechanikája nyilvánvaló: keresse meg az oszlop maximumát, és ellenőrizze, hogy a pár második tagja a sor maximuma. Ha ezek a feltételek teljesülnek, a cella Nash -egyensúlyt képvisel. Ellenőrizze az összes oszlopot, hogy megtalálja az összes NE cellát. Egy N × N mátrix 0 és N × N közötti tiszta stratégiájú Nash-egyensúlyi lehet.

Stabilitás

A stabilitás fogalma, amely sokféle egyensúly elemzésében hasznos, Nash -egyensúlyokra is alkalmazható.

A Nash egyensúly egy vegyes stratégiájú játékban stabil, ha egy játékos valószínűségeiben egy kis változás (pontosabban végtelen kicsi változás) olyan helyzethez vezet, amelyben két feltétel áll fenn:

  1. a játékosnak, aki nem változott, nincs jobb stratégiája az új körülmények között
  2. a játékos, aki változtatott, most szigorúan rosszabb stratégiával játszik.

Ha mindkettő teljesül, akkor a játékos, akinek kis változása van a vegyes stratégiájában, azonnal visszatér a Nash -egyensúlyba. Az egyensúly állítólag stabil. Ha az egyik feltétel nem áll fenn, akkor az egyensúly instabil. Ha csak az egyik feltétel teljesül, akkor valószínűleg végtelen számú optimális stratégia áll rendelkezésre a megváltozott játékos számára.

A fenti "vezetési játék" példában vannak stabil és instabil egyensúlyok is. A 100% -os valószínűséggel vegyes stratégiákat magában foglaló egyensúly stabil. Ha bármelyik játékos kissé megváltoztatja a valószínűségeit, mindketten hátrányba kerülnek, és ellenfelüknek nincs okuk sorra megváltoztatni a stratégiájukat. Az (50%, 50%) egyensúly instabil. Ha bármelyik játékos megváltoztatja a valószínűségeit (ami nem járna előnyökkel vagy károsítaná a változtatást végző játékos elvárásait , ha a másik játékos vegyes stratégiája továbbra is fennáll (50%, 50%)), akkor a másik játékosnak azonnal jobb stratégiája van vagy (0%, 100%) vagy (100%, 0%).

A stabilitás döntő fontosságú a Nash -egyensúly gyakorlati alkalmazásában, mivel az egyes játékosok vegyes stratégiája nem teljesen ismert, de a játékban végzett cselekedeteik statisztikai megoszlásából kell következtetni. Ebben az esetben a gyakorlatban nagyon valószínűtlen az instabil egyensúly kialakulása, mivel az egyes stratégiák arányainak minden apró változása a stratégia megváltoztatásához és az egyensúly lebomlásához vezet.

A Nash -egyensúly csak az egyoldalú eltérések szempontjából határozza meg a stabilitást. A kooperatív játékokban egy ilyen koncepció nem elég meggyőző. Az erős Nash -egyensúly lehetővé teszi minden elképzelhető koalíció eltérését. Formálisan az erős Nash -egyensúly olyan Nash -egyensúly, amelyben egyetlen koalíció sem, ha kiegészítéseinek intézkedéseit a megadott módon fogadja el, együttműködve nem térhet el oly módon, hogy minden tagja előnyös legyen. Az erős Nash -koncepciót azonban néha túl "erősnek" tartják, mivel a környezet lehetővé teszi a korlátlan privát kommunikációt. Valójában az erős Nash -egyensúlynak Pareto -hatékonynak kell lennie . Ezen követelmények következtében az erős Nash túl ritka ahhoz, hogy hasznos legyen a játékelmélet számos ágában. Azonban az olyan játékokban, mint a választások, ahol a lehetséges kimenetelnél jóval több játékos van, ez gyakoribb lehet, mint a stabil egyensúly.

A finomított Nash-egyensúly koalícióbiztos Nash-egyensúlyként (CPNE) akkor fordul elő, amikor a játékosok nem tudnak jobban teljesíteni, még akkor sem, ha megengedik nekik, hogy kommunikáljanak, és "önfenntartó" megállapodást kössenek az eltérésről. Minden korrelált stratégia, amelyet az iterált szigorú dominancia támogat, és a Pareto határán CPNE. Továbbá lehetséges, hogy egy játék Nash -egyensúlyával rendelkezik, amely ellenáll a meghatározott méretű, k -nál kisebb koalícióknak. A CPNE a mag elméletéhez kapcsolódik .

Végül a nyolcvanas években az ilyen ötletekre alaposan építve Mertens-stabil egyensúlyokat vezettek be megoldásként . A Mertens stabil egyensúly kielégíti az előre és hátra indukciót . A játékelmélet kontextusában a stabil egyensúlyok általában Mertens stabil egyensúlyaira utalnak.

Esemény

Ha egy játék egyedi Nash egyensúlyban van, és bizonyos feltételek mellett játsszák a játékosok között, akkor az NE stratégia kerül elfogadásra. Elegendő feltételek biztosítják a Nash -egyensúly lejátszódását:

  1. A játékosok minden tőlük telhetőt megtesznek annak érdekében, hogy a játék által leírt módon maximalizálják várható hozamukat.
  2. A játékosok hibátlanok a kivitelezésben.
  3. A játékosok kellő intelligenciával rendelkeznek a megoldás megállapításához.
  4. A játékosok ismerik a többi játékos tervezett egyensúlyi stratégiáját.
  5. A játékosok úgy vélik, hogy a saját stratégiájuktól való eltérés nem okoz eltérést más játékosok részéről.
  6. Van köztudott , hogy minden játékos teljesíti ezeket a feltételeket, beleértve ezt. Tehát nemcsak minden játékosnak tudnia kell, hogy a többi játékos megfelel a feltételeknek, hanem azt is, hogy mindannyian tudják, hogy megfelelnek nekik, és azt is, hogy tudják, hogy tudják, hogy találkoznak velük stb.

Ahol a feltételek nem teljesülnek

Példák a játékelméleti problémákra, amelyeknél ezek a feltételek nem teljesülnek:

  1. Az első feltétel nem teljesül, ha a játék nem írja le helyesen azokat a mennyiségeket, amelyeket a játékos szeretne maximalizálni. Ebben az esetben nincs különösebb oka annak, hogy az adott játékos egyensúlyi stratégiát fogadjon el. Például a fogoly dilemmája nem dilemma, ha bármelyik játékos örül, ha határozatlan időre börtönbe kerül.
  2. Szándékos vagy véletlen tökéletlenség a végrehajtásban. Például egy hibátlan logikai játékra képes számítógép egy másik hibátlan számítógéppel szemben egyensúlyt eredményez. A tökéletlenség bevezetése annak megzavarásához vezet, vagy a hibát elkövető játékos elvesztése, vagy a köztudat kritériumának tagadása révén, amely a játékos lehetséges győzelméhez vezet. (Példa lehet egy játékos, aki hirtelen hátramenetbe állítja az autót a csirke játékban , biztosítva a veszteség nélküli nyerés nélküli forgatókönyvet).
  3. Sok esetben a harmadik feltétel nem teljesül, mert annak ellenére, hogy az egyensúlynak léteznie kell, a játék összetettsége miatt nem ismert, például a kínai sakkban . Vagy ha ismert, akkor nem minden játékos tudja, mint amikor tic-tac-toe játékot játszik egy kisgyerekkel, aki kétségbeesetten nyerni akar (megfelel a többi kritériumnak).
  4. A közismertség kritériuma még akkor sem teljesülhet, ha valójában minden játékos megfelel az összes többi kritériumnak. A játékosok, akik helytelenül bíznak egymás racionalitásában, ellenstratégiákat alkalmazhatnak a várható irracionális játék ellenfeleik nevében. Ez fő szempont például a " csirke " vagy a fegyverkezési verseny esetében.

Ahol a feltételek teljesülnek

Ph.D. értekezésében John Nash kétféle értelmezést javasolt egyensúlyi koncepciójára, azzal a céllal, hogy bemutassa, hogyan kapcsolhatók össze az egyensúlyi pontok a megfigyelhető jelenséggel.

(...) Az egyik értelmezés racionalista: ha feltételezzük, hogy a játékosok racionálisak, ismerik a játék teljes felépítését, a játékot csak egyszer játsszák le, és csak egy Nash -egyensúly van, akkor a játékosok ennek az egyensúlynak megfelelően fognak játszani .

Ezt az elképzelést formalizálta Aumann, R. és A. Brandenburger, 1995, Epistemic Conditions for Nash Equilibrium , Econometrica, 63, 1161-1180, akik minden játékos vegyes stratégiáját más játékosok viselkedésére vonatkozó sejtésként értelmezték, és bebizonyították, hogy ha a játék és a játékosok racionalitása kölcsönösen ismert, és ezek a sejtések közismertek, akkor a feltételezéseknek Nash -egyensúlynak kell lenniük (ehhez az eredményhez általában előzetes feltételezés szükséges, de két játékos esetében nem. Ebben az esetben a sejtéseket csak kölcsönösen kell ismerni).

A második értelmezés, amelyet Nash a tömeges cselekvési értelmezésben említ, kevésbé igényes a játékosokkal szemben:

[i] t fölösleges feltételezni, hogy a résztvevők teljes mértékben ismerik a játék teljes felépítését, vagy képesek és hajlandók bármilyen bonyolult érvelési folyamaton keresztülmenni. Feltételezzük, hogy a játék minden pozíciójához tartozik egy résztvevők száma, amelyet a különböző populációkból véletlenszerűen kiválasztott résztvevők játszanak végig. Ha van egy stabil átlagos gyakoriság, amellyel minden tiszta stratégiát a megfelelő populáció átlagos tagja alkalmaz, akkor ez a stabil átlagos gyakoriság vegyes stratégia Nash -egyensúlyt jelent.

Ennek hivatalos formájához lásd Kuhn, H. és munkatársai, 1996, "The Work of John Nash in Game Theory", Journal of Economic Theory , 69, 153–185.

A korlátozott feltételek miatt, amelyekben az NE ténylegesen megfigyelhető, ritkán kezelik őket a mindennapi viselkedés útmutatójaként, vagy megfigyelik a gyakorlatban az emberi tárgyalások során. A közgazdaságtan és az evolúcióbiológia elméleti koncepciójaként azonban az NE -nek magyarázó ereje van. A gazdaságban a megtérülés a hasznosság (vagy néha a pénz), az evolúciós biológiában pedig a génátvitel; mindkettő a túlélés alapvető eredménye. Azok a kutatók, akik a játékelméletet alkalmazzák ezeken a területeken, azt állítják, hogy azok a stratégiák, amelyek bármilyen okból nem tudják maximalizálni ezeket, versenyeznek a piacon vagy a környezetben, és ezek tulajdonítják az összes stratégia tesztelési képességét. Ez a következtetés a fenti " stabilitási " elméletből származik. Ezekben a helyzetekben a kutatások gyakran megerősítették azt a feltételezést, hogy a megfigyelt stratégia valójában ÉK.

ÉK és nem hiteles fenyegetések

Kiterjedt és normál formájú illusztrációk, amelyek bemutatják a különbséget az SPNE és más NE között. A kék egyensúly nem tökéletes aljáték, mert a második játékos 2 (2) -kor nem hiteles fenyegetést tesz arra, hogy rosszindulatú (U).

A Nash -egyensúly az aljáték tökéletes Nash -egyensúlyának felülhalmaza. Az aljáték tökéletes egyensúlya a Nash -egyensúly mellett megköveteli, hogy a stratégia is Nash -egyensúly legyen a játék minden aljátékában. Ez kiküszöböli az összes nem hiteles fenyegetést , vagyis azokat a stratégiákat, amelyek nem racionális lépéseket tartalmaznak annak érdekében, hogy az ellenjátékos megváltoztassa stratégiáját.

A jobb oldali képen egy egyszerű szekvenciális játék látható, amely illusztrálja a problémát az aljáték tökéletlen Nash -egyensúlyával. Ebben a játékban az egyik a bal (L) vagy a jobb (R) opciót választja, amelyet a második játékos követ, hogy kedvesnek (K) vagy kedvesnek (U) szóljon az első játékoshoz. A második játékos azonban csak nyerhet rosszindulatú, ha az egyik játékos balra megy. Ha az első játékos jól jár, akkor a racionális kettes játékos de facto kedves lenne vele az aljátékban. A nem hiteles fenyegetés azonban, hogy 2 (2) -kor rosszindulatú lesz, továbbra is a kék (L, (U, U)) Nash-egyensúly része. Ezért ha mindkét fél racionális viselkedést várhat el, akkor az aljáték tökéletes Nash -egyensúlya jelentősebb megoldás lehet, ha ilyen dinamikus következetlenségek merülnek fel.

A létezés bizonyítéka

Bizonyítás a Kakutani fixpontos tétel használatával

Nash eredeti bizonyítása (dolgozatában) Brouwer fixpontos tételét használta (pl. Egy változatot lásd alább). Egyszerűbb bizonyítást nyújtunk a Kakutani fixpontos tétel segítségével , Nash 1950-es tanulmánya alapján ( David Gale- nek tulajdonítja azt a megfigyelést, hogy az ilyen egyszerűsítés lehetséges).

A Nash -egyensúly meglétének bizonyítására az i játékos legjobb válasza minden más játékos stratégiájára.

Itt, ahol egy vegyes stratégiájú profil található az összes kevert stratégia készletében, és ez a kifizetési funkció az i játékos számára. Határozzon meg egy meghatározott értékű függvényt úgy, hogy . A Nash -egyensúly megléte egyenértékű a fix ponttal.

Kakutani rögzített pont tétele garantálja a rögzített pont meglétét, ha az alábbi négy feltétel teljesül.

  1. kompakt, domború és üres.
  2. üres.
  3. a felső félig folyamatos
  4. domború.

Az 1. feltétel teljesül abból a tényből, hogy szimplex és így kompakt. A konvexitás a játékosok stratégiák keverési képességéből következik. nem üres, amíg a játékosok stratégiákkal rendelkeznek.

A 2. és 3. feltétel teljesül Berge maximális tételével . Mivel folyamatos és kompakt, nem üres és felső félfolyamatos .

A 4. feltétel teljesül a vegyes stratégiák eredményeként. Tegyük fel , akkor . azaz ha két stratégia maximalizálja a megtérülést, akkor a két stratégia keveréke ugyanazt a kifizetést eredményezi.

Ezért létezik egy fix pont és egy Nash -egyensúly.

Amikor 1949-ben Nash ezt a pontot John von Neumann -hoz intézte, von Neumann híresen elutasította a következő szavakkal: "Ez triviális, tudod. Ez csak egy fixpontos tétel ." (Lásd Nasar, 1998, 94. o.)

Alternatív bizonyítás a Brouwer fixpontos tételével

Van egy játékunk, ahol a játékosok száma és a játékosok akciói vannak. Minden cselekvési halmaz véges. Hagyja halmaza kevert stratégiák a játékosok. Az s végessége biztosítja a tömörségét .

Most definiálhatjuk az erősítési függvényeket. Egy vegyes stratégiát , hagyjuk, hogy a nyereséget játékos a cselekvés legyen

A nyereségfüggvény azt a hasznot jelöli, amelyet a játékos a stratégia egyoldalú megváltoztatásával kap. Most meghatározzuk, hogy hol

számára . Azt látjuk

Ezután meghatározzuk:

Könnyen belátható, hogy mindegyik érvényes vegyes stratégia . Azt is könnyű ellenőrizni, hogy mindegyik folyamatos függvény , és ezért folyamatos függvény. Mint véges számú kompakt domború halmaz keresztterméke, kompakt és domború is. Ha a Brouwer rögzített pont tételét alkalmazzuk, és arra a következtetésre jutunk, hogy rögzített pontja van , hívjuk . Azt állítjuk, hogy ez egy Nash -egyensúly . Ebből a célból elegendő annak bemutatása

Ez egyszerűen azt állítja, hogy minden játékos semmilyen előnnyel nem jár, ha egyoldalúan megváltoztatja stratégiáját, ami pontosan szükséges feltétele a Nash -egyensúlynak.

Most tegyük fel, hogy a nyereség nem minden nulla. Ezért, és így . Akkor jegyezd meg azt

Szóval engedd

Ezenkívül nyereségvektorként kell jelölnünk a ben végrehajtott műveletek alapján . Mivel ez a fix pont, rendelkezünk:

Mivel van, hogy van néhány pozitív méretezés a vektor . Most ezt állítjuk

Ennek megtekintéséhez először is megjegyezzük, hogy ha ez igaz a nyereségfüggvény definíciója szerint. Most tegyük fel, hogy . Korábbi kijelentéseink szerint ez van

és így a bal kifejezés nulla, ami azt jelenti, hogy a teljes kifejezés szükség szerinti.

Szóval ez végre megvan

ahol az utolsó egyenlőtlenség következik, mivel nem nulla vektor. De ez egyértelmű ellentmondás, így minden nyereségnek valóban nullának kell lennie. Ezért szükség esetén Nash -egyensúly .

Nash -egyensúlyok számítása

Ha az A játékos domináns stratégiával rendelkezik, akkor létezik Nash -egyensúly, amelyben A játszik . Két játékos A és B esetében létezik egy Nash -egyensúly, amelyben A játszik , B pedig a legjobban . Ha szigorúan domináns stratégia, akkor A minden Nash -egyensúlyban játszik . Ha mind A, mind B rendelkezik szigorúan domináns stratégiákkal, akkor létezik egy egyedi Nash -egyensúly, amelyben mindegyik a szigorúan domináns stratégiáját játssza.

A vegyes stratégiájú Nash-egyensúlyi játékokban annak a valószínűsége, hogy a játékos bármilyen konkrét (ilyen tiszta) stratégiát választ, kiszámítható úgy, hogy minden stratégiához hozzárendelünk egy változót, amely rögzített valószínűséget jelent a stratégia megválasztására. Annak érdekében, hogy egy játékos hajlandó legyen randomizálni, az egyes (tiszta) stratégiák várható megtérülésének azonosnak kell lennie. Ezenkívül az adott játékos egyes stratégiáihoz tartozó valószínűségek összegének 1 -nek kell lennie. Ez létrehoz egy egyenletrendszert, amelyből az egyes stratégiák kiválasztásának valószínűségei származtathatók.

Példák

Egyező fillérek
Stratégia A B játékos H -t játszik A B játékos T -t játszik
Az A játékos H -t játszik −1, +1 +1, −1
Az A játékos T -t játszik +1, −1 −1, +1

A megfelelő filléres játékban az A játékos pontot veszít B -nek, ha A és B ugyanazt a stratégiát játssza, és egy pontot nyer B -től, ha különböző stratégiákat játszanak. A vegyes stratégiájú Nash-egyensúly kiszámításához rendelje A-nak a H valószínűséggel játszott p valószínűségét és (1− p ) a T játékot, és B-nek a H lejátszásának q valószínűségét és (1− q ) a T játszásának valószínűségét .

E [nyeremény A játékért H] = (−1) q + (+1) (1− q ) = 1−2 q
E [nyeremény A játékért T] = (+1) q + (−1) (1− q ) = 2 q −1
E [nyeremény A játékért H] = E [nyeremény A játékért T] ⇒ 1−2 q = 2 q −1 ⇒ q = 1/2
E [nyeremény B játékért H] = (+1) p + (−1) (1− p ) = 2 p −1
E [nyeremény B játékért T] = (−1) p + (+1) (1− p ) = 1−2 p
E [nyeremény B játszik H] = E [nyeremény B játszik T] ⇒ 2 p −1 = 1−2 pp = 1/2

Így ebben a játékban a vegyes stratégiájú Nash-egyensúly az, hogy minden játékos véletlenszerűen válassza a H vagy T p = 1/2 és q = 1/2 értékeket.

Az egyensúlyi pontok furcsasága

1971 -ben Robert Wilson előállította a furcsaság -tételt, amely szerint "szinte minden" véges játéknak véges és páratlan számú Nash -egyensúlya van. 1993 -ban Harsanyi alternatív bizonyítékot tett közzé az eredményről. A "majdnem minden" itt azt jelenti, hogy minden olyan játék, amelynek végtelen vagy páros egyensúlya van, nagyon különleges abban az értelemben, hogy ha a nyereményét akár csak véletlenszerűen is megzavarják, akkor valószínű, hogy egy páratlan számú egyensúly lesz.

Ingyenes Pénz Játék
Stratégia A B játékos igennel szavaz A B játékos nemmel szavaz
Az A játékos igennel szavaz 1, 1 0, 0
Az A játékos nemmel szavaz 0, 0 0, 0

A fogoly dilemmájának például egy egyensúlya van, míg a nemek harcában három- kettő tiszta és egy vegyes, és ez akkor is igaz, ha a kifizetések kissé változnak. Az ingyenes pénz játék egy példa a "különleges" játékra, ahol páros egyensúly van. Ebben két játékosnak mindketten igennel kell szavazniuk, nem pedig nemmel, hogy jutalmat kapjanak, és a szavazatok egyidejűek. Két tiszta stratégiájú Nash-egyensúly létezik (igen, igen) és (nem, nem), és nincs vegyes stratégiai egyensúly, mivel az "igen" stratégia gyengén uralja a "nem" -t. Az "igen" ugyanolyan jó, mint a "nem", függetlenül a másik játékos akciójától, de ha van esélye, a másik játékos az "igen" -t választja, akkor az "igen" a legjobb válasz. A nyeremények kis véletlenszerű zavarása esetén azonban annak a valószínűsége, hogy bármelyik nyeremény kötött marad, akár 0 -nál, akár más számnál, elhanyagolhatóan kicsi, és a játék helyette egy vagy három egyensúlyt tartalmaz.

Lásd még

Megjegyzések

Hivatkozások

Játékelméleti tankönyvek

Eredeti Nash papírok

Egyéb hivatkozások

Külső linkek