Nash Equilibrium
Diferența de timp dintre scrierea tezei și a devenit un test universal acceptat pentru matematică. Genius fără a recunoaște avut ca rezultat tulburări mintale grave, dar, de asemenea, sarcina Dzhon Nesh a fost în măsură să rezolve datorită minții excelente logicheskumu. Teoria lui de „echilibru Nash“ a fost distins cu Premiul Nobel, și viața sa în adaptarea filmului «Beautiful minte» ( «A Beautiful Mind") filmul.
Pe scurt despre teoria jocurilor
Deoarece teoria echilibrului Nash explică comportamentul uman în termeni de interacțiune, deci ar trebui să ia în considerare conceptele de bază ale teoriei jocului.
Teoria jocurilor studiază comportamentul participanților (agenți), în condițiile de interacțiune între ele, pe tipul de joc în care rezultatul depinde de deciziile și comportamentul câtorva oameni. Parte va lua decizii bazate pe așteptările lor cu privire la comportamentul altora, și care se numește o strategie de jocuri de noroc.
Există, de asemenea, o strategie dominantă, în care participantul primește cel mai bun rezultat pentru orice comportament al altor participanți. Acesta este cel mai bun jucător de strategie bezproigryshnaya.
Dilemei prizonierului și descoperire
prizonier dilemă - acesta este cazul cu jocul, în cazul în care jucătorii sunt obligați să ia decizii raționale, atingerea unui obiectiv comun în alternative de conflict. Întrebarea este, care dintre aceste opțiuni le alege, realizând interes personal și generale, precum și incapacitatea de a obține ceva, și multe altele. Jucători precum închis într-un condiții de joc dure, care, uneori, le face cred că foarte productiv.
Această dilemă a explorat matematicianul american Dzhon Nesh. Equilibrium, pe care a condus, a fost revoluționar în felul său. Gândul puternic nou influențat opinia economiștilor cu privire la modul de a face o varietate de jucători de pe piață, ținând seama de interesele altora, cu o interacțiune densă și intersecția de interese.
Cel mai bine este de a studia teoria jocurilor cu exemple concrete, pentru că această disciplină foarte matematică nu este uscată și teoretică.
Un exemplu de dilema prizonierului
Exemplul Doi oameni jaf comis, cad în mâinile poliției și sunt interogați în camere separate. În același timp, miniștrii de poliție oferă fiecare participant condiții favorabile în care acesta va fi lansat în cazul depune mărturie împotriva partenerului său. La fiecare dintre infractori au următorul set de strategii care va lua în considerare:
- Atât în același timp, să depună mărturie și de a lua în închisoare timp de 2,5 ani.
- Atât în același timp, tăcut și primi 1 an, pentru că în acest caz, baza de dovezi ale vinovăției lor va fi mic.
- Se dă mărturie și a primit libertatea, iar celălalt este silențios și primește 5 ani de închisoare.
Evident, rezultatul cauzei depinde de decizia ambelor părți, dar nu pot ajunge la un acord, pentru că stând în celule diferite. De asemenea, un conflict clar vizibil de interesul lor personal în lupta pentru interesul comun. Fiecare dintre deținuți au două opțiuni, și 4 rezultate diferite.
Circuit deducții logice
Astfel, infractorul dar să ia în considerare următoarele opțiuni:
- Sunt liniștit și tăcut partenerul meu - amândoi primi 1 an de închisoare.
- Am închiriat un partener și el mi întinde - amândoi obține 2,5 ani de închisoare.
- Sunt tăcut, și partenerul meu să renunțe - Aduc 5 ani în închisoare, iar el este liber.
- Am închiriat un partener, dar el tace - am obține libertatea, și el la 5 ani de închisoare.
Aici este o matrice de soluții posibile și a rezultatelor pentru claritate.
Tabelul rezultatele probabile ale dilemei prizonierului.
Problema este că fiecare participant va alege?
„Taci, nu se poate spune“ sau „nu pot să tac, să vorbească“
Pentru a înțelege alegerea partidului, trebuie să treacă prin lanțul gândurilor sale. În urma raționamentul penal și dacă nu spun nimic și nu spun nimic partenerul meu, vom obține o perioadă minimă de timp (1 an), dar nu pot vedea cum se va comporta. Dacă el dă dovadă împotriva mea, eu, de asemenea, mai bine pentru a da probe, sau pot sta jos timp de 5 ani. Prefer să stau pe 2,5 ani, de 5 ani. Dacă el ar spune nimic, mai ales eu trebuie să depună mărturie pentru că am obține atât de liber. În mod similar, discuțiile și partidul B.
Este ușor de înțeles că strategia dominantă pentru fiecare dintre infractori - aceasta dă dovadă. Punctul optim al acestui joc apare atunci când atât infractorul depune mărturie și de a primi lor „premiul“ - 2,5 ani de închisoare. Teoria lui Nash de jocuri un echilibru apeluri.
soluție suboptimală optimă Nash
neshevskogo Revolutionariness că un astfel de echilibru nu este optimă, dacă luăm în considerare participantul individuale și interesul său personal. La urma urmei, cea mai bună opțiune - este de a păstra tăcerea și să fie eliberat.
Nash Equilibrium - este punctul de contact de interes, în care fiecare participant selectează această opțiune, care cel mai bine pentru el numai cu condiția ca ceilalți participanți selectați o anumită strategie.
Având în vedere exemplul de realizare, atunci când atât infractorul tăcut și primi numai la 1 an, acesta poate fi numit Pareto varianta optimă. Cu toate acestea, este posibilă numai în cazul în care infractorii au putut să ajungă la un acord în prealabil. Dar chiar și acest lucru nu ar garanta acest rezultat, pentru că tentația de a se retrage din afacere și pentru a evita pedeapsa mare. Lipsa de încredere deplină în reciproc și pericolul de a obține 5 ani forțând selectați cu recunoaștere. Pentru a reflecta asupra faptului că participanții vor lipi la versiunea cu tăcut, care acționează în mod concertat, pur și simplu irațional. O astfel de concluzie poate fi făcută, dacă studiem echilibrul Nash. Exemplele dovedesc numai dreapta.
Egoistul sau rațional
Teoria echilibrului Nash a dat concluzii uimitoare oprovergnuvshie existente înainte de principii. De exemplu, Adam Smith a considerat comportamentul fiecăruia dintre participanți ca complet egoist, și care aduce sistemul înapoi în echilibru. Această teorie a fost numită „mâna invizibilă a pieței“.
Dzhon Nesh a văzut că în cazul în care toate părțile vor acționa, urmărind doar propriile interese, niciodată nu va conduce la rezultate optime de grup. Având în vedere că gândirea rațională este inerentă fiecărui participant, mai multe sanse de alegere, care oferă strategia de echilibru Nash.
experiment de sex masculin Purely
Un exemplu frapant este jocul „paradox blond“, care, deși se pare că din loc, dar este o ilustrare vie, care arată modul în care teoria jocurilor Nash.
În acest joc trebuie să ne imaginăm că societatea oamenilor liberi a intrat în bar. In apropiere este compania de fete, dintre care una este de preferat la alta, spune blonda. Ca băieții să se comporte, pentru a obține cele mai bune prietena pentru tine?
Deci, baieti raționament: dacă toată lumea va face cunoștință cu blonda, atunci cel mai probabil, nu va primi nimeni, atunci prietenii ei nu vor dori să iubească. Nimeni nu vrea să fie cea de a doua opțiune de toamna-spate. Dar dacă voi alege, pentru a evita blonda, atunci probabilitatea fiecăruia dintre baieti pentru a găsi un bun prieten în rândul fetelor este mare.
situație de echilibru Nash nu este optim pentru baieti, deoarece, urmăresc doar propriile lor interese egoiste, s-ar putea alege o blondă. Se vede că doar urmărirea unor interese egoiste ar echivala cu prăbușirea intereselor de grup. echilibru Nash ar însemna că fiecare tip acționează în propriile sale interese, care sunt în contact cu interesele întregului grup. Această opțiune sub nivelul optim pentru fiecare persoană, dar optime pentru fiecare, în funcție de succesul total al strategiei.
Toată viața noastră este un joc
Luarea deciziilor în lumea reală este foarte similar cu jocul, în cazul în care vă așteptați la un anumit comportament rațional de la alți membri. In afaceri, pentru a lucra într-o echipă, în cadrul companiei sau chiar într-o relație cu sexul opus. De la tranzacții mari și la situații de viață obișnuite totul este supus unei anumite legi.
Desigur, situații de joc considerate criminali si bar - este doar ilustrații excelente care prezintă un echilibru Nash. Exemple de astfel de dileme apar adesea pe piața reală, și mai ales în cazul celor două monopolurilor care controlează piața.
strategii mixte
De multe ori nu vovlekaemy într-una, ci în mai multe jocuri. Prin alegerea uneia dintre opțiunile pentru același joc, ghidat de o strategie rațională, dar obține un alt joc. După mai multe decizii raționale, s-ar putea găsi că rezultatele nu sunt. Ce să ia?
Luați în considerare două tipuri de strategii:
- Pure strategie - este comportamentul participantului, care se bazează pe analiza privind comportamentul posibil al altor participanți.
- strategie mixtă sau o strategie casual, - această alternanță a strategiilor pure de selecție aleatoare sau strategie pură, cu o anumită probabilitate. Această strategie este, de asemenea, numit rendomizirovannoy.
Având în vedere acest comportament, vom obține o nouă perspectivă asupra echilibrului Nashua. Dacă mai devreme că jucătorul alege strategia odată ce este posibil să ne imaginăm și alte comportamente. Se poate presupune că opțiunea pe care jucătorii aleg strategii la întâmplare cu o anumită probabilitate. Jocurile în care nu se poate găsi un echilibru Nash în strategiile pure, întotdeauna le-au amestecat.
Nash Equilibrium strategii mixte numit echilibru mixt. Este un echilibru, în cazul în care fiecare participant alege frecvența optimă selectarea strategiilor lor, cu condiția ca ceilalți membri aleg strategiile lor cu o frecvență predeterminată.
Sancțiuni și strategie mixtă
Un exemplu de strategie mixtă poate fi pus în joc de fotbal. Cea mai bună ilustrare a strategiei mixte - aceasta este, probabil, o serie de sancțiuni. Deci, avem un portar care poate sari doar într-un colț, iar jucătorul care va bate un penalty.
Deci, în cazul în care prima dată când un jucător alege o strategie pentru a face un impact în colțul din stânga, iar portarul se încadrează, de asemenea, în acest colț și prinde mingea, modul în care evenimentele se pot dezvolta a doua oară? În cazul în care un jucător se va bate colțul opus, este probabil să fie prea evident, dar, de asemenea, o lovitură la același unghi nu mai puțin evidente. Prin urmare, portarul și aluat nu are nici o alegere, ci să se bazeze pe selecție aleatoare.
Astfel, alternând de selecție aleatorie a unei anumite strategii pură, jucător și portarul pytajutsja pentru a obține rezultate maxime.