冷扑之后 注重平衡的高水准德扑单挑AI或成行业新宠
4月14日消息AI程序“冷扑大师”以792,327总记分牌的战绩击败“中国龙之队”,部分棋牌游戏行业的AI科学家表示,冷扑之后,一批注重“平衡性”的高级德扑单挑AI或许可以成为行业的新宠。
德扑
德扑相较于棋类项目和电子游戏项目,其最大的不同点在于对局策略的整体性和贯穿全场的心理博弈。此外,平衡和针对,是德扑水平高低的两个主要评判标准。平衡指对整体策略、手牌价值、加注范围等对局意图的隐藏;针对指通过观察对手漏洞,分析其后手策略,并加以打击。
水木智娱AI科学家郑蓝舟表示,冷扑之所以可以大胜龙之队,主要原因并不是外界所传的“人工智能有了心理博弈的能力”,相反,它只是发挥了机器的优势,将平衡性做到了 。由于人类思考能力有限,并且有情感干扰,在德扑对局中会偏向针对性的策略,虽然冷扑大师在对局中曾选出部分让人类玩家得利的牌,但在系列牌局的处理上,将意图隐藏得近乎完美,以致对手无法找到漏洞而采用加注等一些激进的、诱导性的方式来刺探,最终失去了自己的节奏。
德州扑克在近两年的棋牌游戏市场发展迅速,并凭借其游戏特性收获了一批以商业公司高管为主的核心玩家。在冷扑大师之前,德扑游戏的AI主要用于简单的新手教程、跟注风险分析等层面,而现在,一个关于“平衡性”和“针对性”的话题开始在行业内部热议。
部分游戏制作人和高端玩家表示,冷扑在处理不完全信息上的逻辑是不依赖于猜测、获取信息,而是在概率上平衡自己,对抗信息的不透明。这种逻辑推翻了此前“针对性至上”的德扑游戏思路,这会引导更多的人从数学、从博弈论的角度去研究相关游戏的AI,而一批高端的德扑单挑AI或许将在近期问世。
除了游戏方面的应用,郑蓝舟表示,博弈论是一门和商业关联度非常高的数学分支,在现实商业社会里,信息的不对等不透明的是很常见的,往远一点想,冷扑大师的算法和逻辑可能会应用到在线的商业谈判这样的领域。