即使是“石头剪刀布”,人类也不能玩!2
admin
2020-11-19 02:02:41
0

如果说有一种解决问题的方法能跨域文化、种族和地域,那么除了抽签这种纯靠运气的方式,恐怕只剩下猜拳了。
人们普遍认可 “石头-剪刀-布” 三者之间的克制关系。“公平+随机” 的特性使其不仅是活跃气氛的小游戏,更能作为一种相对公平的解决问题的手段,广泛应用在解决分歧,决定顺序,或者确定归属的关键时刻。

更不用说,在谁洗碗,谁拖地,谁做饭等家务活,猜拳用自己的“舍得赌输”能有效维护家庭和谐,堪称随叫随到的家庭关系调解员。

在大多数人的认知中,猜拳是一个随机事件,玩家获胜的概率应该是相同的,在三分之一,但可能不是这样。

浙江大学的何帆教授团队开发了基于马尔可夫链的人工智能模型。 经过300轮与52名人类球员的战斗,AI击败了95%的球员。

连“石头剪刀布”,人类也玩不过AI了

图|模型的净赢数的AI变化

对于人类玩家来说,规则是赢2分,平1分,输不得分。 在与AI作战之前,参与者知道获胜会得到金钱的回报,总分越高,获胜的钱就越多。 因此,玩家故意放水或随机选择的概率很低。

即便如此,AI 仍然大胜人类。在最悬殊的一场较量中,AI 获得了 198 次胜利,55 次平手,仅输了 47 次,胜率超过人类对手 4 倍。全部 15600 回合详尽的原始博弈数据,在论文的补充资料中给出(详见参考文献)。
如果猜拳胜负真的是随机概率,那么从统计学的角度来讲,15600 场比赛下来,AI 获得如此大优势的概率非常低。

拥有“智囊团”的Multi-AI模型

从本质上讲,猜拳是一个游戏问题,它包含了经典的纳什均衡,每个个体的习惯、认知、策略和策略的变化都会影响实际获胜率。 例如,如果你熟悉你的对手,你可能知道他/她经常给布,所以你可以用更多的剪刀来约束它。

浙江大学何赛灵教授团队提出的 AI 模型就是利用了类似的方法,证明了猜拳真的存在针对不同个体的长期制胜策略,可以有效提高胜率。
这套 AI 模型基于 n-阶马尔可夫链设计,拥有记忆性,能够向前追溯最多 n 个历史状态并加以利用。
为了在实战中应对人类玩家的不同性格和策略,研究团队还发明了一套 Multi-AI 模型。
“建立对每个人都有效的单一模型很困难,因此我们决定将单个模型结合起来,使其能够区分和适应更多不同的竞争策略。” 研究人员在论文中解释称。
在与人类对战的第一 Multi-AI 模型中,他们放入了 1-5 阶马尔可夫链,即 5 个独立的 AI 模型,分别参考之前 1-5 个动作。Multi-AI 会从整体上参考 5 个 AI 模型各自的决策,至于选择哪个,还要看它们最近 5 次的表现。
这里的 “最近 5 次” 被定义为一个超参数,名为 Focus length,可以视情况调整大小,实现进一步优化。在与人类对战的第二套 Multi-AI 模型中,该参数就被设为了 10。

连“石头剪刀布”,人类也玩不过AI了

图 | Multi-AI 模型的决策逻辑
打个比方,每一个 n 阶马尔可夫链模型就像是一位军师,各自有不同的决策标准。而 Multi-AI 模型就是司令,手底下有好多名军师组成的智囊团。做决策时,每个军师会提交自己的出拳建议,司令会根据他们过去几次(Focus Length)的表现,采纳综合分数最高的人的建议,以提高长期胜率。
如果人类玩家连续胜利,就会促使 Multi-AI 转向选择其他 AI 模型的更优解。如果人类玩家连续失败,大概率会转换策略,或者打破之前的出拳规律,这时 Multi-AI 也可以随之调整。
最终的社会实验结果反映出了这个想法的有效性。在 52 名志愿者中,只有不到 5 人击败了 AI。很多人都在最初 20-50 个回合里处于领先,但随后就被 AI 捕捉到了隐藏的行为模式,饮恨败北。
那些击败 AI 的人,胜率也只是稍微高出一些,并未拉开太大差距。

6 年前被质疑的研究

值得一提的是,在开发 AI 模型背后的算法,研究团队阅读了 6 年前另一个浙大团队的研究成果,但使用了另一种不同的博弈策略。
相较于之前对于所有玩家数据整体以统计学的方式进行研究,这里的 Multi-AI 模型更强调针对不同玩家之间的个性差异、出拳策略,来及时的进行调控,选取当下最适宜的博弈策略。
2014 年 5 月,很多媒体都报道了一项以 “石头剪刀布” 游戏为对象的科研成果。

本研究课题原本是“可控实验社会游戏系统中的一些不平衡统计物理问题”,但媒体和舆论关注的焦点大多是“如何提高猜拳的胜率”,因此也被质疑为浪费金钱。

不是真的。 这项研究也被麻省理工学院科技评论评为2014年的最佳结果之一(预印本。

连“石头剪刀布”,人类也玩不过AI了

图 | 2014 年《麻省理工科技评论》的报道
论文揭示了猜拳游戏背后蕴藏着不同的行为模式,比如赢家倾向于下一轮出同样的手势,而输家倾向于改变;人们更愿意出石头等等。但更深层的主旨是探讨纳什均衡在真实博弈中是否成立,研究现实中的博弈模型框架,并且分析游戏中的宏观周期现象与微观行为基础。这其中用到的基础理论涉猎博弈论、心理学和神经科学等多个领域。
类似的,2020 年这项关于 “石头剪刀布” 的最新研究,成果不仅仅是一个很厉害的猜拳 AI,还是一个很厉害的循环制衡模型分析师。未来有望拓展到其他博弈场景,比如预测竞争对手的下一步举动,规划更有效的竞选策略,或者制定更有利的定价方案等等。

“[我们发现]人类的竞争行为确实遵循可以通过使用适当的简单模型加以利用的规则。” 关于竞争行为的模式以及如何使用它们,预计将使我们能够更好地建模、预测和适应不同的竞争模式。 “

相关内容

热门资讯

开心切西瓜v1.0.1 开心切西瓜是一款趣味十足且玩法上手简单的休闲冒险游戏。在这款游戏中,玩家需要通过操控着飞刀来进行游戏...
刺客信条启示录补丁v1.0.8 刺客信条启示录补丁免费版,描述的是一款关于刺客信条的简单使用的游戏功能性补丁工具,此款工具可以帮助玩...
消逝的光芒2环境雾气去除补丁v... 消逝的光芒2环境雾气去除补丁是一款很好玩的末日生存游戏,玩家将进入到末日环境中开展新的冒险,在游戏中...
可口的咖啡下载无限金币钻石0.... 可口的咖啡无限金币钻石是一款模拟经营游戏,玩家可以在这里进购不同产地的咖啡豆制作出各种香气扑鼻的咖啡...
节奏宝剑20244.0.8 节奏宝剑2024的玩法非常不错,玩家们可以在关卡中进行节奏挑战,通过各种技巧和道具来进行打击节奏,游...
托卡发廊22.3-play 托卡发廊2是一款模拟经营游戏,游戏采用了美式卡通的画风,玩家可以根据顾客的需求,使用不同的工具打造出...
蠢蠢的死法3安卓版1.4 蠢蠢的死法3安卓版是一款休闲闯关游戏,游戏为大家带来了丰富的小游戏可以进行尝试,这些小游戏都有着非常...
绝对音准跑酷1.5.32 绝对音准跑酷游戏中玩家在关卡中根据节奏发出对应的声音,准确喊出相应的音准,只有这样才能顺利通过每个关...
角斗士罗马求生正版1.34.8 角斗士罗马求生正版这款游戏是一款超级好玩的冒险对战游戏,在游戏中不同的国度中探索不同的地区进行寻找建...
憨豆先生送快递中文版(Spec... 憨豆先生送快递中文版这款游戏是一款非常有趣的模拟送快递休闲手游,每次配送都会有很多有趣的包裹成为朋友...
森林冒险日记安卓版300.1.... 森林冒险日记安卓版的玩法很有趣,玩家可以在游戏中收集各种资源,为自己的角色购买更多的衣服和装饰品,用...
西游捉妖日记免费版1.0.0 西游捉妖日记免费版的玩法很烧脑,玩家们可以在关卡中观察,通过各种场景细节,在关卡中完成目标,帮助唐僧...
宝可梦咖啡厅最新版(Pok&#... 宝可梦咖啡厅最新版是一款模拟经营游戏,在这里,玩家需要通过消除的方式经营一家餐厅,游戏玩法非常的解压...
全面憨憨战争模拟器正版1.0.... 全面憨憨战争模拟器正版这款游戏是一款非常好玩的模拟战争对战游戏,在游戏中朋友们可以给自己的兵团进行各...
僵尸大逃杀内置功能菜单MODv... 僵尸大逃杀内置功能菜单MOD游戏中玩家需要创建益智队伍,通过不断的训练增强实力,强化防御,才能应对越...
挤在一起的猫猫游戏1.13 挤在一起的猫猫是一款非常解压的休闲拼图游戏,游戏设置了大量的关卡,这些关卡都有着全新的内容等你来挑战...
桑塔与海盗的诅咒两项修改器1.... 桑塔与海盗的诅咒是一款好玩的海盗冒险游戏,这款游戏中的剧情很丰富,玩家还可以在剧情中进行战斗,本期为...
爱丽丝疯狂回归存档1.0 爱丽丝疯狂回归存档这款游戏存档是一款十分有趣的存档补丁,使用这个存档补丁可以让朋友们解锁游戏中的各种...
隔离区丧尸末日生存十一项修改器... 隔离区丧尸末日生存十一项修改器这款游戏是一款有众多修改功能的游戏修改器,游玩隔离区丧尸末日生存游戏的...
拳皇98终极对决七项修改器1.... 拳皇98终极对决是一款经典IP下的格斗对战游戏,玩家们可以在游戏中选择自己喜喜欢的角色进行搓招对战,...