18新利最新登入博弈论是如何工作的

韩国和美国士兵参加医疗疏散(医疗)在Yangju实地训练,韩国。博弈理论表明,在战争中,士兵的最佳选择是战斗——即使这意味着持续伤害。
钟Sung-Jun /盖蒂图片社

想象你是一个士兵贴在防线。明天,将会有一个伟大的战斗。有两种可能的结果的战斗(胜利或失败),为你和两个可能的结果(生存或死亡)。显然,你的偏好是生存。

如果你失败,你会死。18新利最新登入然而,即使防线持有,你可能会死在战场上。看来,你最好的选择是逃跑。但是如果你这样做了,留下来的人,战斗可能会死。你意识到防线上的每一个人的想法一样。所以如果你决定留下来,但其他人逃离合作,你一定会死。

广告

这个问题一直困扰军事战略家们因为战争的开始。这就是为什么通常有一个新的环境进入方程——如果你逃跑或缺陷,你将作为一个叛徒。因此,生存的最佳机会是保持你的位置在直线上,争取胜利。

18新利最新登入这与博弈论如何?

博弈论不是研究如何赢得国际象棋的游戏或如何创建一个角色扮演游戏18新利最新登入的场景。通常,博弈论远程甚至不与你一般认为是一个游戏。

在最基本的层面上,博弈论是研究人们如何、公司或国家(称为18新利最新登入代理球员)确定策略在不同的情况下,面对竞争策略是由其他代理或球员。博弈理论假定代理做出理性的决策。有一些错误在这个假设:通过对非理性行为的社会(累积的核武器)被认为是很理性的博弈理论的标准。

18新利最新登入然而,即使当博弈理论分析产生违反直觉的结果,它仍然收益率令人惊讶的洞察人性。例如,只做的社会成员相互合作为了物质利益,还是有更多的吗?你能帮助别人在需要长期如果它伤害你吗?

为什么一个理性的人必须学习行为自私,继续下一节。

囚徒困境

18新利最新登入HowStuffWorks 2008

最好的方法之一来理解博弈论的一些基本原则是看一个经典博弈论的例子:囚徒两难的境地。这个游戏检查两名球员如何基于交互的理解18新利最新登入动机和策略。囚徒困境是一场游戏,两名球员——都在犯罪嫌疑人的担忧。他们逮捕,带到警察局。如果两个嫌疑人(称为保护对方,保持安静合作以博弈理论计算),警察只有足够的证据将每个入狱五年。

18新利最新登入然而,每个嫌疑犯提供了一个交易。如果一个承认(背叛从合作关系),另一个嫌疑人没有,叛逃者将获得自由,而寡言的嫌疑人将得到20年的监禁。如果都承认,都得到10年监禁。

广告

似乎彼此双方通过合作中获益。获得20年的牢狱之灾是一个不可接受的结果。因为其中一个有一个机会去平安的叛变,这两名球员知道另一个思考同样的问题,都必须出于自身利益的缺陷。在这一过程中,犯罪嫌疑人获得10年期的句子。这不是最好的结果,但它是最好的战略形势球员发现自己。

两名球员之间的任何协议或衷心承诺合作只保证两个,事实上,秘密缺陷。共同承诺不承认实际上鼓励忏悔,导致自由自私的(最好的个人的结果)。

这是囚徒困境。博弈论者已经确定,承认总是在这种情况下双方的答案。这样做的原因是,两党必须假设其他将只有利益。

我们可以检查情况通过绘制出来矩阵。矩阵允许我们检查所有可能的策略和组合将产生的结果。

确定的动机,我们会指定一个范围的首选项不同的结果,1代表最坏的结果(20年监禁)和4最好的(免费):

  • 20年:1
  • 十年:2
  • 5年:3
  • 免费的:4

现在我们知道我们的结果和偏好,以及我们可用的策略:不承认(球员)之间的合作或承认(背叛)。我们可以看到不同的组合18新利最新登入策略会产生不同的结果。结果由number-pairs,第一个数字代表玩家1,第二个数字代表玩家2的结果。

现在,评估你的选择通过检查结果在每一列表示。看第一列,我们看到2大于1,第二列,4比3。所以,你最好的策略,无论什么你的伴侣,是缺陷(承认)。自从你忏悔的结果比不承认的结果,这就是所谓的一个严格的主导作用。

为什么不博弈理论家研究纸牌吗?请继续往下读。

游戏

约翰·冯·诺依曼合著者的“游戏和经济行为的理论,”给出了一个临时的美国哲学协会之前关于计算机的讲座。
阿尔弗雷德艾森/生命/时间/盖蒂图片社照片

约翰·冯·诺依曼和奥斯卡·摩根斯特在1943年向世界介绍了博弈论“游戏和经济行为的理论。”的y hoped to find mathematical answers to economic problems.

根据经济理论,生产者可以等反应条件更大利润的供给和需求。但这些理论没有考虑到其他生产商的策略,以及这些策略的预期如何影响每个生产商的动作。18新利最新登入博弈理论试图解释所有这些战略的交互。没多久,军事战略家看到价值。

广告

当我们讨论博弈论,我们假设几件事:

  • 一个游戏被认为是任何一个场景,在该场景中,两名球员能够互相竞争战略,以及战略选择的一个球员会影响其他玩家的行动。纯靠运气的游戏不计数,因为没有选择的自由,因此涉及任何策略。和一个球员的游戏,比如纸牌,不是被博弈论者认为是游戏,因为他们不需要战略两个玩家之间的交互。
  • 玩家在游戏中可以知道每一个可能的行动,任何球员。我们也知道所有可能的结果。所有玩家都首选项对于这些可能的结果,作为球员,我们知道不仅自己的偏好也的其他玩家。
  • 结果是可以衡量的实用程序球员或价值,源于他们。如果你喜欢到A点到B点,然后点具有较高的实用程序。通过知道你值/ B, B / C,一个球员可以预见你的行动,计划占他们的策略。
  • 所有玩家的行为理性。在某种程度上甚至看似非理性的行为是理性的。例如,如果你要玩两个游戏,你不会故意失去你在第一场比赛,除非你相信这样做会提高你的对手的信心当他或她决定赌多少游戏2——一个游戏你预期获胜。18新利最新登入这是一个重要的区别只有一次的重复游戏。只有一次的游戏,你玩一次;多次重复的游戏,你玩。(稍后,我们将看看如何理性思考变化之间的一次性和重复游戏。)18新利最新登入
  • 如果没有球员可以达到更好的结果通过切换策略,比赛陷入了僵局称为纳什均衡。从本质上讲,这可以归结为玩家保持当前的策略(即使他们没有最高优先)因为切换不会完成任何事。

在下一节中,我们将使用这些信息,看看我们可以通过策划学习策略博弈树。18luck手机登录

用博弈树

18新利最新登入HowStuffWorks 2008

在前一节中,我们检查了囚徒困境,策划一个矩阵。的一个例子simultaneous-move游戏。游戏是simultaneous-move或sequential-move游戏。在simultaneous-move游戏,这两名球员没有知识的其他球员的移动而移动。这样盲目的拍卖作品,竞标合同。在sequential-move游戏中,玩家轮流移动,如国际象棋或谈判。

同时对游戏的玩家,我们必须假定对手会寻求可能的最好的结果。因此,我们必须保护自己,也最有利的行动。玩家会选择不同的策略在“囚徒困境”如果是按顺序而不是同时?

广告

虽然simultaneous-move游戏能放到矩阵,可以绘制在sequential-move游戏博弈树。囚徒困境映射在博弈树看起来像这样:

动作的顺序是自上而下的树上。的最节点代表玩家1的第一步(承认或不承认)。下面是两个节点现在进行。每个代表玩家2的可能反应的第一步。四个节点的最后一行终端节点并代表所有四个可能的回报这个特定的游戏。

我们可以看看游戏这种形式,为玩家做出最后的选择最好的策略在游戏中移动,这是玩家2。这让我们向后工作来确定移动玩家1应该知道球员2将理性行为在任何场景。18新利最新登入这个从end-to-beginning看比赛的过程逆向归纳。我们看到玩家2的最佳策略是承认,无论玩家1的开放移动。进一步通过移动我们的分析树,游戏的开始,我们知道玩家1必须选择背叛(忏悔)。

我们看到,在一个只有一次的游戏像囚徒困境,同时或顺序不改变每个球员的最佳策略。

在下一节中,我们将了解为什么完全理性自私必须抛出窗外当我们玩囚徒困境。

只有一次的游戏与重复游戏

参议院能源,高级成员Pete v . Domenici参议院多数党领袖Mitch McConnell,参议员John Cornyn介绍2008年美国能源生产法案。参议员经常使用博弈论原理获得支持他们提出的法案。
斯科特·j·法瑞尔/国会季刊/盖蒂图片社

只有一次的游戏,如我们之前的囚徒困境的例子,风险很高,但没有进一步的影响。18新利最新登入然而,当玩重复博弈一次性战略可能不是最好的行动:你和你的对手可以获得更好的回报长期合作(不承认)和其他叛逃(承认)。这有助于您调查对方的策略和被称为混合策略

假设你知道你囚徒困境只是一个场景在一系列重复的游戏。所以你选择不承认你的第一步。而不是利用这个球员2可能回报你的信任,也不承认,导致最好的相互回报:每个入狱五年。在重复游戏考虑战略对手的名声和未来的合作,所以这些游戏可以玩出比只有一次的不同的游戏。

广告

事实上,即使你重复游戏,但还是知道有多少场比赛,双方球员都将期望效用最大化的其他在最后叛变,或本系列的最后一场比赛。18新利最新登入知道了这一点,这两名球员意识到他们必须在倒数第二个缺陷。但由于双方球员知道,将最优策略,他们将每个玩他们最自私的策略此举之前,等等,直到他们在其他系列的第一场比赛。这是唯一的机会,要么球员这样做,以免立即下降到一个缺点,从来没有恢复。

玩一系列游戏没有结束,玩家可以采用针锋相对的战略,惩罚叛逃的对手。球员比赛在这种背叛自己的背叛预定数量的动作,之前试图重建信任。这被称为触发策略。例如,如果参议员1合作法案由参议员2,但参议员2不回报合作,参议员1可能会拒绝当参议员合作2提出他或她的下一个比尔:针锋相对。

另一个触发策略严峻的触发策略,玩家1合作直到玩家2的缺陷,导致玩家1缺陷的一举一动之后不管未来合作的球员2。而针锋相对的离开房间的原谅,严峻的触发策略是一个无休止的背叛。

有时,球员威胁grim-trigger战略和不遵循它。这就是所谓的廉价的谈话:一个没有承诺的威胁。如果你的未婚夫在但没有打破他的公寓的租赁,这是廉价的谈话。如果他伯恩斯他的故居在地上(和获得纹身你的名字),这是承诺。

继续阅读学习博弈论拯救世界——或者几乎毁了它,每天几18新利最新登入十年。

博弈论和冷战

博弈论者托马斯•谢林和Robert Aumann交付诺贝尔演讲在斯德哥尔摩皇家学院,瑞典,2005年12月。
亨利克·蒙哥马利/法新社/盖蒂图片社

博弈论的发展加速了二战期间以创纪录的速度。虽然目的是经济学奖,美国和苏联很快就看到其价值形成的战争策略。

在冷战初期,艾森豪威尔政府18新利最新登入核武器像任何其他武器使用[来源:斯宾塞]。博弈理论家托马斯•谢林官员相信核武器只是有用的威慑。此外,他建议美国应该有各种各样的反应可以召唤与进攻的大小。

广告

平衡是在没有国家可以通过核攻击获得优势,报复也会是毁灭性的。这是被称为相互保证毁灭(疯了)。这种平衡需要公开承认每个民族的长处和弱点。18新利最新登入然而,正如囚徒困境告诉我们的那样,这两名球员必须承担另一种是只关心自身利益;因此,每个必须限制风险采取的主要策略。

如果一个国家改变力量的平衡(例如通过建立导弹防御系统,),它会导致一个战略失误,导致核战争?政府咨询博弈论来防止这种失衡。当一个国家建立了导弹发射井,其他国家有针对性的。前苏联和美国之后全球传播出去,藏他们推出网站,要求两国承诺更多的导弹可能第一次罢工以减少的报复能力。他们也一直拥有核武器的天空中飞机在空中提供一种威慑,如果仓库被毁。作为另一个威慑,他们建立了拥有核武器潜艇。这几乎涵盖所有基地:地面、空中和海上。

气氛紧张,有一个不断威胁的误解导致了灾难性的后果。在如此大规模的不信任,甚至一个防御性举措(如建筑防空洞)可以被视为挑衅。建造防空洞,例如,使它看起来像你期望的麻烦。你为什么希望麻烦,除非你打算开始吗?

不理性或者数学测量有意义后发射核武器的国家已经采取了重大打击。重点是什么?世界毁灭为了报复?但如果报复不是威慑,让国家发起第一次罢工?为了抵消第一次罢工的威胁,美国和苏联领导人有时使用“疯子战略”或发布谣言,他们精神不稳定或盲目愤怒继续另一个措手不及。

武器控制和裁军谈判基本上是重复的游戏,允许双方合作奖励和惩罚背叛。通过多次会议和增加沟通、信任和合作导致了(一些)裁军和更少的战略姿态。这在很大程度上也是由于所需的资源维护日益增长的核能力。

幸运的是,没有国家愿意玩游戏的最后阶段中涉及到的最好的结果,只能庆祝胜利的少数幸存者在地下。

所以除了冷战策略,如何博弈理论是有用的吗?18新利最新登入发现下一个。

其他的游戏和应用程序

中国消费者携带环保袋,因为政府已经宣布在全国范围内禁止免费塑料袋,以减少原油消耗。环保是一个现实生活中的公共物品游戏的例子。
中国的照片/盖蒂图片社

博弈论也是有用的社会学研究。有不同的游戏或场景理论用于分析行为模式。其中之一是最后通牒游戏

最后通牒游戏(只有一次的游戏),两名球员开始一无所有。玩家1给出了10美元,指示给部分玩家2,谁可以接受或拒绝提供。如果玩家2接受玩家1的报价,这两名球员带着东西离开。但是如果球员2拒绝提供,没有利润。

广告

理论家们起初以为玩家1将会提供严重不均匀分裂(只有2美元的10美元,例如)和球员2会接受,因为它总比没有好。这支持早期经济模型表明一个球员总是出于自身利益行为。所以,如果玩家1提供了1美元,球员2会接受。毕竟,有总比没有好。18新利最新登入然而,研究表明,即使在只有一次的场景中,玩家2有时会拒绝。可以解释球员2只是侮辱这样一个出价,因为它是不公平的。但这是真的吗?

当接受2美元,获得可以视为净或相对的。因此,从一个角度看,每次2美元总比没有的好。18新利最新登入然而,如果你的净收益是两美元,你有先进的从一个同等价值的指向你的对手(没有)的一个伟大的相对劣势,在过程中,你的对手一个移动现在有6美元以上。根据情况,可能有利于拒绝任何报价分割并不均匀。

这是什么好?嗯,通过研究玩家如何行为在这个游戏中18新利最新登入,我们可以学到真正激励人。经济理论认为,让尽可能多的钱是最重要的。然而,我们知道,生18新利最新登入活不仅仅是一个追求。但生存是很重要的,我们使用它反映其他值。研究参与者属于文化价值送礼更有可能让提供收件人。其他文化可能下降有利的报价,因为接受送礼者会带来一个义务[来源:亨利克先生]。

博弈论在另一个应用程序的调用进化理论,每个玩家被视为自己的策略。也就是说,你代表你的祖先的决定的结果。如果你的祖先选择偷他们的邻居,你生存策略的化身。这些策略竞争优势,某些策略将主导和复制,形式的孩子。最终,这些将成为其他策略由纯粹的数字。

一个场景叫做公共物品测试玩家的合理性。在这个游戏中,一组六名球员得到10美元。他们然后告知任何钱导致一般池将增至三倍,所有玩家之间分配均匀,不管有多少贡献或多少。18新利最新登入理性的行动方针是缺陷——没有贡献和受益于任何股息可能会。幸运的是,在现实生活中,人们有时偏离理性,导致锅中。一个现实生活中的例子的公共物品游戏环境。是否一个人投资金钱或努力环境管理,个人将受益于任何贡献。

博弈论是借口寻找第一?继续往下读。

对博弈论的批评

德国小孩在花园里玩Spreekita幼儿园在柏林。幼儿园小朋友的行为最好的例证了博弈论的经济模式。
约翰MACDOUGALL /法新社/盖蒂图片社

尽管其适用的功能,博弈论也不是没有批评。有人指出,博弈论可以帮助只有这么多了,如果你试图预测现实的行为。每一个行动,好或坏,可以合理利己主义的名称。

常数与博弈论建模困难是定义、限制、隔离或会计每组因素和变量影响策略和结果。总有一个未知因素,只是不能占。例如,没有策略可以预测一位谈判者的行为在一个宗教启示的阵痛。

广告

博弈论是基于理性的。在传统的经济模式,理性的最大化自己的收益。因此,在任何情况下,你总是会获得尽可能多的行动,不管它如何影响他人。18新利最新登入有趣的是,研究发现,研究对象的经济模式最有可能完全接受自私,payoff-maximizing代理是幼儿园的学生,但是,到四年级时,他们的行为开始支持合作策略[来源:亨利克先生]。

博弈论认为,球员之间的合作总是理性的策略,至少在参与一个博弈论的实验(即使这意味着失去了比赛)。考虑一下这个场景:您参与你被告知的是只有一次的游戏。为了赢得这场比赛,你必须利用其他球员。这样做和胜利后,你知道这个游戏是两个游戏系列之一。

现在的角色是相反的。test-givers想看到球员2将表现在第一场比赛球员18新利最新登入1缺陷后——这是这项研究的真正目的。你的理性,在第一场比赛现在是非理性的自我最大化行动的框架之外只有一次的游戏。

Test-givers经常欺骗考生作为策略来获得最优结果:完整的知识在不同的游戏场景中玩家的战略选择。隐藏的测试者的策略游戏本身的本质将主导中的任何球员的策略游戏。测试者收到最大信息(提供最实用的一个更大的框架内test-giv18luck手机登录ing)。这个信息来18l18新利最新登入17;ck手机登录了,然而,牺牲玩家,他揭示了一个同胞他或她愿意生活的缺陷在更大的框架内。

囚徒困境告诉我们我们必须假设代理总是扮演主导战略18新利最新登入。因此,最好的策略博弈理论实验假设测试者是操纵游戏让玩家透露的信息。18luck手机登录在游戏中,它总是更好的合作——即使这意味着失去了比赛。最坏的结果从这个战略仍然是一个可以接受的结果。从本质上讲,失去一个实验性游戏当你被骗不是这样的损失——只要你维护你的声誉在一系列更大的生活场景。

是合理利用一个球员在假设(并且可能误导)参数的游戏当你可能需要与他们分享电梯之后?问问你自己,在你的下一个董事会会议。

有关博弈论的更多信18luck手机登录息,请访问下一个页面上的链接。

更多的信息18luck手机登录

相关文章

更大的链接

来源

  • Branas-Garza,巴勃罗。“促进帮助行为与框架在独裁者游戏。”Journal of Economic Psychology. August 2007 (May 9, 2008). http://www.sciencedirect.com/science?_ob=ArticleURL&_udi= B6V8H-4MFCVST-1&_user=10&_rdoc=1&_fmt=&_orig=search&_ sort=d&view=c&_acct=C000050221&_version=1&_urlVersion=0&_ userid=10&md5=89443199abdab66180afdce858c5ea5b
  • 卓别林,维吉尼亚州。“普林斯顿和数学:一个值得关注的记录。”Princeton Alumni Weekly, May 9, 1958. http://www34.homepage.villanova.edu/robert.jantzen/princeton_math/pmcxpaw.htm
  • 戴德里安,Hovnan。戴德里安”一个消息从大主教Hovnan 7月4日的场合。”Western Diocese of the Armenian Church. June 29, 2007. http://www.armenianchurchwd.com/A-Message-from-Archbishop-Hovnan- Derderian-on-the-occasion-of-4th-of-July/
  • 经济学家。“钱不是万能的。”July 5th,2007年。http://www.economist.com/science/displaystory.cfm?story_id=9433782
  • 研究经济学的术语表。艾德。彼得·b·迈耶。(2008年5月9日)。http://econterms.com
  • 哈特,Sergiu。“Robert Aumann采访。”Center for the Study of Rationality, the Hebrew University of Jerusalem. January 2005 (May 15, 2008). http://www.ma.huji.ac.il/hart/papers/md-aumann.pdf
  • Hauert,克里斯托弗。“公共产品”。January 2005 (May 9, 2008).http://www.univie.ac.at/virtuallabs/PublicGoods
  • 亨利克先生,约瑟夫。“人类社会性的基础:实验在15个小规模社会。”California Institute of Technology. (May 9, 2008). http://www.hss.caltech.edu/roots-of-sociality/phase-i
  • 互联网电影数据库。《奇爱博士》或“剧情简介:我如何学会停止忧虑,爱上炸弹18新利最新登入”(2008年5月9日).北京:/ /www.imdb.com/title/tt0057012/synopsis
  • 詹姆斯,奥利弗。“再想想:新的研究表明精神分裂症药物并不总是工作。”的Guardian. October 22, 2005. http://lifeandhealth.guardian.co.uk/experts/oliverjames/story/0,,1619897,00.html
  • 经济行为和组织杂志》上。“互惠两部分独裁者游戏。”一个vner Ben-Ner, Louis Putterman, Fanmin Kon, Dan Magan. December 3, 2002 (May 9, 2008). http://www.econ.brown.edu/fac/Louis_Putterman/working/pdfs/chig_aer.pdf
  • Krieger,卢。“小游戏理论”。Lou Krieger Online. (May 9, 2008). http://www.loukrieger.com/articles/gametheory.htm
  • 曼德尔,迈克尔。“诺贝尔经济学失望。”Businessweek, Oct. 11, 2005. http://www.businessweek.com/bwdaily/dnflash/oct2005/nf20051011 _3028_db084.htm
  • 麦凯布,凯文。“最后通牒游戏是什么?”Neuroeconomics. September 24, 2003 (May 9, 2008). http://neuroeconomics.typepad.com/neuroeconomics/2003/09/what_is_the_ult.html
  • PBS。“赫尔南科尔特斯抵达墨西哥。”(2008年5月9日)。http://www.pbs.org/kpbs/theborder/history/timeline/1.html
  • 普林斯顿大学图书馆。在1930年代“普林斯顿数学社区:一个口述历史项目。”(2008年5月9日)。http://www.math.princeton.edu/quicklinks/
  • 雷诺兹,温斯顿。“燃烧的船只赫尔南科尔特斯。”Hispania, Vol. 42, No. 3, pg. 317-324. September, 1959. http://www.jstor.org/pss/335707
  • 肖,迈克。“游戏理论在电影、音乐和小说:《辛普森一家》。”(2008年5月9日)。http://www.gametheory.net/popular/reviews/Simpsons.html
  • 斯宾塞,迈克尔。“Counterintuition先生:美国与复杂的敌人更安全。”Wall Street Journal. February 17, 2007. http://www.opinionjournal.com/editorial/feature.html?id=110009690
  • 斯坦福哲学百科全书。“博弈论”。March 10, 2006 (May 9, 2008). http://plato.stanford.edu/entries/game-theory/
  • 苏瑞,Jeremi。“十月核武器:理查德·尼克松的秘密计划给越南带来和平。”Wired.com. February 25, 2008 (May 9, 2008). http://www.wired.com/politics/security/magazine/ 16-03/ff_nculearwar?currentPage=all/
  • Weisstein,埃里克·W。十六进制的“游戏”。MathWorld -- a Wolfram Web Resource. http://mathworld.wolfram.com/GameofHex.html
  • 惠特克,罗伯特。“精神药物可能会阻碍经济复苏。”USA Today. March 3, 2002. http://www.usatoday.com/news/opinion/2002/03/04/ncguest2.htm
Baidu