Об альтруизме, или Честность - лучшая политика

теория игр, "задача о заключённых" и равновесия по Нэшу и Парето
 

Fakir

BlueSkyDreamer
★★★★☆
Давеча, беседуя со старым другом (который рванул из атмосферщиков в экономисты и получает второе высшее в РЭШ) за рюмкой чая, вспомнили к слову о теории игр, разных равновесиях и "задаче о заключенных".

Суть задачи: двоих граждан взяла полиция по подозрению в каком-то неблаговидном поступке (скажем, ограблении банка). Каждому ставятся следующие условия (содержатся подозреваемые порознь):
1. Если заложишь подельника, а он тебя нет - он получит 10 лет, ты гуляешь на волю.
2. Если ты молчишь, но подельник тебя закладывает - ты получаешь червонец, он гуляет.
3. Если ты закладываешь его, а он, в свою очередь тебя - оба вы, голуби, сидите по 5 лет.
4. Если ты молчишь, и молчит подельник - оба получаете по году.

Вопрос: каковы стратегии подозреваемых, и чем дело кончится? Если каждый подозреваемый ставит своей задачей минимизацию собственного ущерба (т.е. желает свалить сам, а кореш - хрен с ним) - кончится тем, что оба отсидят по 5 лет. Называется это - равновесие по Нэшу.

Однако несколько позже т-щ Парето обратил внимание, что если оба подозреваемых окажутся не жлобами - участь их будет менее печальна, и отсидят они всего по году. Это уже равновесие по Парето.

Вывод: честность - лучшая политика :) Вернее, порядочность.

Фигня, казалось бы - однако серьёзные дяди, в том числе экономисты, широко применяют понятия равновесий по Нэшу и по Парето, в том числе применительно к экономическому состоянию разных стран. И пытаются объяснить экономический успех одних и проблемы других, в частности, тем, что в одних странах стратегия каждого предпринимателя - нагреть других (т.е. законченный эгоизм - думать только о себе, наплевав на ущерб остальных), а в других чудаки думают и об общественной выгоде. В результате "социум Парето" оказывается богаче и успешнее "социума Нэша" (да и по-человечески симпатичнее).

А причём здесь альтруизм - надеюсь, пояснять не надо :)
 

BrAB

аксакал
★★
Fakir> Фигня, казалось бы - однако серьёзные дяди, в том числе экономисты, широко применяют понятия равновесий по Нэшу и по Парето, в том числе применительно к экономическому состоянию разных стран. И пытаются объяснить экономический успех одних и проблемы других, в частности, тем, что в одних странах стратегия каждого предпринимателя - нагреть других (т.е. законченный эгоизм - думать только о себе, наплевав на ущерб остальных), а в других чудаки думают и об общественной выгоде. В результате "социум Парето" оказывается богаче и успешнее "социума Нэша" (да и по-человечески симпатичнее).

а такие страны реально существуют?
Было у еврея всё плохо. Пришел за советом к равину. Тот - напиши над дверью - "Так будет не всегда". Стало всё ок. Пошел он благодарить. А тот ему - надпись не стирай. Злой чечен ползет на берег. ©Лермонтов  
RU Фагот #07.12.2005 10:35
+
-
edit
 

Фагот

координатор
★★☆
Я что-то не понимаю - они ограбление совершали, или нет?
Если нет, то почему отсутствует 5-й вариант ответа: "послать всех на ... и потребовать адвоката?" :lol:
 

TEvg

аксакал

админ. бан
>а такие страны реально существуют?

В чистом виде - нет, а вот в сравнительном - да.
"социум Парето" - СССР
"социум Нэша" - РФ
 
RU Фагот #07.12.2005 11:05
+
-
edit
 

Фагот

координатор
★★☆
Если серьёзно, то странно делать кальку с максимально упрощённых человеческих отношений на экономическую модель общества, причём даже не на саму модель, а на её идеологию.

Ну и BrAB правильно заметил: где те страны?
 

Zeus

Динамик

Fakir> Суть задачи: двоих граждан взяла полиция по подозрению в каком-то неблаговидном поступке (скажем, ограблении банка). Каждому ставятся следующие условия (содержатся подозреваемые порознь):
Fakir> 1. Если заложишь подельника, а он тебя нет - он получит 10 лет, ты гуляешь на волю.
Fakir> 2. Если ты молчишь, но подельник тебя закладывает - ты получаешь червонец, он гуляет.
Fakir> 3. Если ты закладываешь его, а он, в свою очередь тебя - оба вы, голуби, сидите по 5 лет.
Fakir> 4. Если ты молчишь, и молчит подельник - оба получаете по году.
Fakir> Вопрос: каковы стратегии подозреваемых, и чем дело кончится? Если каждый подозреваемый ставит своей задачей минимизацию собственного ущерба (т.е. желает свалить сам, а кореш - хрен с ним) - кончится тем, что оба отсидят по 5 лет. Называется это - равновесие по Нэшу.

Неверно. Если исходить из разумности обоих (и того, что каждый, будучи подельником, знает все о другом: т.е. знает, что другой знает, что тот разумен... и т.п.) В этом случае каждый догадается о таком исходе и будут действовать по другому плану. Дело ограничится годом даже при полном эгоизме каждого.
И животноводство!  

Fakir

BlueSkyDreamer
★★★★☆
Ты подумай над следующим уровнем рефлексии :)
Если каждый из них разумен, но хотя бы один - эгоистичен, то эгоист, понимая, что подельник из разумных соображений его не заложит, тут же заложит своего подельника, чтобы моментально выйти на свободу.

и того, что каждый, будучи подельником, знает все о другом: т.е. знает, что другой знает, что тот разумен...
 


Считай, что они случайные подельники - ничего друг о друге не знают :)

Неверно.
 


Расскажи это Нэшу ;):D
 

ED

аксакал
★★★☆
☠☠
Фагот>почему отсутствует 5-й вариант ответа...?
Потому, что это задача :-)

Здесь как-то приводили ссылку на статью Р.Докинза «Эгоистичный ген». Там это задача подробно обсасывается. Весьма интересно, число стратегий гораздо больше четырёх.
 
Рациональный игрок всегда будет закладывать, так как в классической некооперативной игре каждый игрок стремится максимизировать свою выгоду (в данном случае-уменьшить время отсидки; выплата равна 10-время отсидки). Заложить-это доминатная стратегия для ЛЮБОГО игрока, т.е. в любом случае ход "заложить" приносит бОльшую выплату.

Можно сделать небольшой финт ушами и предположить что есть вероятность p того, что игрок-"альтруист".
Для "альтруиста" выплата=его выплата+1/2 выплаты второго игрока.

Для матрицы

5,5 10,0
0,10 9,9

Получаем 7.5p+10(1-p)=5p+13.5(1-p) (если предположить что если второй игрок-альтруист, то он не заложит)

Решаем, p=.583.

Стало быть если вы альтруист и вероятность того что второй игрок- альтруист более .583, то лучшей стратегией становиться молчание (а если меньше .583, то по прежнему заложить-это лучшая стратегия)

Это bayesian nash equilibrium.

При желании можно ещё какие-нибудь условия придумать. Некооперативные игры очень чуствительны к правилам.
 
Это сообщение редактировалось 07.12.2005 в 23:47

Zeus

Динамик

Fakir> Ты подумай над следующим уровнем рефлексии :)
Fakir> Если каждый из них разумен, но хотя бы один - эгоистичен, то эгоист, понимая, что подельник из разумных соображений его не заложит, тут же заложит своего подельника, чтобы моментально выйти на свободу.

Вот именно что я подумал. Тут исключительно важна бесконечная рекурсия: он знает, что тот знает, что он знает... "и т.д.", которое я не зря добавил. Иначе говоря, каждый одинаково разумен и каждый знает этот факт о другом, и знает, что другой о нем того же мнения... и опять и т.д., без этого никак :D

Так вот при этих условиях они будут молчать. Или - действовать случайно, кстати. Надо еще подумать.

Fakir> Считай, что они случайные подельники - ничего друг о друге не знают :)

А этого в условии не было :) Надо заранее оговаривать. По умолчанию же принято считать, что "противник" не недооценивается.

Но вообще-то я написал об этом скорее из-за того, что начали эту задачку на общество экстраполировать. И вот тут это становится важно: общество, пусть будучи полностью эгоистично (в смысле каждого индивидуала), но разумное и осознающее сей факт, будет стремиться именно к "равновесию по Парето" (в данной терминологии). Но от этого не перестанет быть эгоистичным. Парето-стратегия просто признается выгодной. И именно на этом многие западные общества и построены, если уж упрощать.

Fakir> Расскажи это Нэшу ;):D [»]

Легко. Давай его сюда :D
И животноводство!  
Это сообщение редактировалось 08.12.2005 в 13:06

Zeus

Динамик

russo> Можно сделать небольшой финт ушами и предположить что есть вероятность p того, что игрок-"альтруист".
russo> Для "альтруиста" выплата=его выплата+1/2 выплаты второго игрока.

А почему именно так? Коли он альтруист, для него "выплата" второго должна быть как минимум не меньше собственной ;) А в пределе - собственная вообще стремиться к нулю.
И животноводство!  

Fakir

BlueSkyDreamer
★★★★☆
Zeus
Вот именно что я подумал. Тут исключительно важна бесконечная рекурсия: он знает, что тот знает, что он знает... "и т.д.", которое я не зря добавил. Иначе говоря, каждый одинаково разумен и каждый знает этот факт о другом, и знает, что другой о нем того же мнения... и опять и т.д., без этого никак
 


Ну вот и получается, что если не уверен в молчании подельника - надежнее и выгоднее заложить. Впрочем, если уверен, то тем более :D
Понимаешь, если ты не думаешь о выгоде партнёра - заложить тебе выгоднее в любом случае.

Так вот при этих условиях они будут молчать. Или - действовать случайно, кстати. Надо еще подумать.
 


А не проще литературу отыскать? ;)

Но вообще-то я написал об этом скорее из-за того, что начали эту задачку на общество экстраполировать. И вот тут это становится важно: общество, пусть будучи полностью эгоистично (в смысле каждого индивидуала), но разумное и осознающее сей факт, будет стремиться именно к "равновесию по Парето" (в данной терминологии). Но от этого не перестанет быть эгоистичным. Парето-стратегия просто признается выгодной.
 


Если встать на позиции бихевиоризма - не так важно, чем именно вызвано действие, если оно такое, какое есть. Общество можно в принципе заставить жить "по Парето" двумя способами: либо объяснив, что это выгодно, либо насадив мораль. Вообще говоря, будучи крепко вбитой в мозги, мораль надежнее (хотя и гибкости не даёт, и глючить может) - потому что опираясь только на рациональность, нет-нет да и мелькнёт у кого-то мысль, что он сильно хитропопый, и сможет максимизировать свою прибыль, не пользуясь "порядочной" стратегией, но используя то, что именно ей пользуются остальные игроки.
 

Fakir

BlueSkyDreamer
★★★★☆
BrAB
а такие страны реально существуют?
 


Я не уверен в точности, что именно имеют в виду экономисты, говоря о таких странах. Но вроде бы и какие-то конкретные страны приводят в пример. Будет случай - уточню.
 
+
-
edit
 

Ира
антигерой

новичок
Рациональный игрок всегда будет закладывать, так как в классической некооперативной игре каждый игрок стремится максимизировать свою выгоду (в данном случае-уменьшить время отсидки; выплата равна 10-время отсидки).
 

Вы товарищ не учитываете простого такого фактора - АВТОРИТЕТ и ЛИЧНАЯ НАДЁЖНОСТЬ.
В вашем понимании Рационалист туповатый человек, не учитывающий этого фактора.

Поэтому "выплата" одного года отсидки повышает авторитет и при следующей сделке вам будет проще получить "продукцию под реализацию". Это называется умным словом: "длинная стратегия", а вы говорите о рационалисте, знакомом только с понятием "короткая тактика".

А причём здесь альтруизм - надеюсь, пояснять не надо :)
 

А при чём здесь он ? АЛЬТРУИЗМ - это гон. Его не бывает - это только работа на авторитет.
Это дальняя стратегия, приносящая выгоду в перспективе. Поэтому её используют только очень умные люди. Русские к ним не относятся. Есть только евреи, которые способны использовать такой подход, ну и чужая нация в критических для себя условиях, когда любой соотечественник становится "братом". Хотя может и у Евреев это произошло потому, что они давненько потеряли родину и постоянно жили на чужой территории.

Поэтому эти правила лишь объяснения того, что в одном социуме больше дураков, в другом умных.
 
Это сообщение редактировалось 25.01.2006 в 10:27

Iva

аксакал


Давеча, беседуя со старым другом (который рванул из атмосферщиков в экономисты и получает второе высшее в РЭШ) за рюмкой чая, вспомнили к слову о теории игр, разных равновесиях и "задаче о заключенных".

Суть задачи: двоих граждан взяла полиция по подозрению в каком-то неблаговидном поступке (скажем, ограблении банка). Каждому ставятся следующие условия (содержатся подозреваемые порознь):
1. Если заложишь подельника, а он тебя нет - он получит 10 лет, ты гуляешь на волю.
2. Если ты молчишь, но подельник тебя закладывает - ты получаешь червонец, он гуляет.
3. Если ты закладываешь его, а он, в свою очередь тебя - оба вы, голуби, сидите по 5 лет.
4. Если ты молчишь, и молчит подельник - оба получаете по году.

Вопрос: каковы стратегии подозреваемых, и чем дело кончится? Если каждый подозреваемый ставит своей задачей минимизацию собственного ущерба (т.е. желает свалить сам, а кореш - хрен с ним) - кончится тем, что оба отсидят по 5 лет. Называется это - равновесие по Нэшу.

Однако несколько позже т-щ Парето обратил внимание, что если оба подозреваемых окажутся не жлобами - участь их будет менее печальна, и отсидят они всего по году. Это уже равновесие по Парето.

Вывод: честность - лучшая политика :) Вернее, порядочность.

А причём здесь альтруизм - надеюсь, пояснять не надо :)
 


Главная фигня в том, что так же доказано, что в данной задаче ( и вообще в данном классе задач) будет равновесие по Нэшу.
И чем больше участников, тем надежнее.
Многие знания - многие печали (с) Эклезиаст 10в до н.э.  
RU Dem_anywhere #13.04.2006 16:19
+
-
edit
 

Dem_anywhere

аксакал
★☆
Главная фигня в том, что так же доказано, что в данной задаче ( и вообще в данном классе задач) будет равновесие по Нэшу.
И чем больше участников, тем надежнее.
 
Если бы ещё реальные задачи сводились к таковым...
Так что стратегией подозреваемого становится изменение условий задачи на такие, при которых "по Нешу" оптимальным станет четвёртый вариант.
Например - угрозой убийства заложившему.
 

Iva

аксакал


Если бы ещё реальные задачи сводились к таковым...
Так что стратегией подозреваемого становится изменение условий задачи на такие, при которых "по Нешу" оптимальным станет четвёртый вариант.
Например - угрозой убийства заложившему.
 


Вот поэтому фермеры способны сдерживать цены на свою продукцию только под угрозой колоссальных штрафов Еврокомиссии, наказывающей нарушителей конвенции.

А при более-менее свободном выборе стратегий - все летит с седловой точки.

Кроме грубой силы нет других способов поддержания Парето, так как оно неустойчиво в принципе. А Неш - он устойчив.

Поэтому все разговоры, что альтруизм выгоден - обман или самообман.

Другое дело, если признается незамкунутость нашего материального мира.
Многие знания - многие печали (с) Эклезиаст 10в до н.э.  
RU Dem_anywhere #17.04.2006 14:04
+
-
edit
 

Dem_anywhere

аксакал
★☆
Кроме грубой силы нет других способов поддержания Парето, так как оно неустойчиво в принципе. А Неш - он устойчив.
 
Да, но всё не так просто. "Грубая сила" - это внутрисистемный фактор :)
Т.е. система сама стремится к варианту Парето...
 

Iva

аксакал


Да, но всё не так просто. "Грубая сила" - это внутрисистемный фактор :)
Т.е. система сама стремится к варианту Парето...
 


То то это заметно в периоды революций :-).
Многие знания - многие печали (с) Эклезиаст 10в до н.э.  

IDEAS

втянувшийся

А как же боязнь причинить боль ближнему
А как же мысль что я шкурно ради себя кидаю человека
А как не страшно ведь через пять лет выйдет и найдет а то и попросит поквитаться сокамерников, а следователь который про себя будет думать что ты шкура.
А соседи и коллеги по работе «что кинул кента».

И экономика здесь не причем
Чёткость, ясность , понятность , жажда совершенства ! Блеск - Воображения! Действовать Действовать Действовать Я не хочу критиковать я хочу придумывать новое и изменять мир .  

Iva

аксакал


А как же боязнь причинить боль ближнему
А как же мысль что я шкурно ради себя кидаю человека
А как не страшно ведь через пять лет выйдет и найдет а то и попросит поквитаться сокамерников, а следователь который про себя будет думать что ты шкура.
А соседи и коллеги по работе «что кинул кента».

И экономика здесь не причем
 


Это все действует ( "когда украл одмн доллар - сажают в тюрьму, когда украл миллион - избмрают сенатором"(с) не помню.) на уровне кражи одного доллара и в маленьком коллективе (деревне).
А уже в масштабах большого города...
Многие знания - многие печали (с) Эклезиаст 10в до н.э.  
RU Dem_anywhere #06.05.2006 13:53
+
-
edit
 

Dem_anywhere

аксакал
★☆
Это все действует ( "когда украл одмн доллар - сажают в тюрьму, когда украл миллион - избмрают сенатором"(с) не помню.) на уровне кражи одного доллара и в маленьком коллективе (деревне).
А уже в масштабах большого города...
 
А то же самое... Заложить незнакомого не получится (просто о нём ничего не знаешь) - а со знакомым как правило связей хватает. И рвать их все - это как из "маленькой деревни" уехать...
 

Fakir

BlueSkyDreamer
★★★★☆
Iva> А при более-менее свободном выборе стратегий - все летит с седловой точки.
Iva> Кроме грубой силы нет других способов поддержания Парето, так как оно неустойчиво в принципе. А Неш - он устойчив.
Iva> Поэтому все разговоры, что альтруизм выгоден - обман или самообман.

Это больно резкий перескок ;)

Если равновесие неустойчиво - это еще отнюдь не значит, что оно невыгодно по каким-то еще критериям :)
 
+
-
edit
 

bashmak

аксакал

Помнится по этой игре проводился конкурс компьютерных стратегий.
В первый год проведения победила стратегия "Око за око".
Во второй и все последующие "Око за око" с возможностью выхода из патовой ситуации.
 
RU Ведмедь #03.11.2007 09:57
+
-
edit
 

Ведмедь

модератор
★★
Задачка больно уж упрощена по самое не балуйся :)
Во-первых, непонятно, какими доказательствами раcполагает следствие - то есть если оба задержаны не in flagranti, а дома или там в кино :), у них ничего при себе нет, на месте преступления не осталось следов, а взяты они только по сообщению оперативных источников - то никто не сядет вообще (если молчать будут, конечно :)).
Во-вторых, требую адвоката!!

Так что экономисту срочно получать третье, юридическое образование - пригодится в жизни :D
 

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru