本篇文章1327字,读完约3分钟
据新浪科技12日报道,加拿大和捷克的研究人员开发出了扑克机器人(300024,Buy),该机器人已经在一对一比赛和无限注德州扑克比赛中击败了人类职业玩家。扑克机器人的胜利标志着人工智能的新突破。
研究人员声称该程序通过“近似方法”击败了人类对手,这有点类似于直觉。密歇根大学的博弈论和人工智能教授迈克尔·韦尔曼说:“如果是这样的话,那就意味着游戏人工智能已经取得了显著的进步。”首先,这是一个里程碑。ai在游戏中击败了扑克专业人士。其次,它结合了一些新的想法,创造了令人兴奋的新方法。我们可以用这种方法来处理不完全信息的游戏。”
本周晚些时候,匹兹堡赌场将举办一场扑克锦标赛,届时几名世界级的扑克玩家将与卡内基梅隆大学开发的程序进行竞争。卡耐基梅隆大学的计算机教授托马斯·桑德霍姆是该程序的主要开发者。他说参赛选手比上一次的测试要好得多。在为期20天的比赛中,玩家将玩12万手扑克牌。研究人员可以进行统计并为开发工作提供帮助。很长一段时间,人们认为扑克对电脑来说太复杂了,而这次比赛可能会向我们证明人工智能在扑克方面可以超越人类。
扑克软件deepstack曾击败职业玩家。它是在加拿大阿尔伯塔大学计算机教授迈克尔·鲍林的领导下开发的,Charest大学和捷克科技大学的研究人员也参与了研究和开发。一份研究报告在网上发表,研究人员称,deepstack与几名人类玩家玩了45000手扑克,轻松获胜。
人类在其他游戏中也遇到过人工智能,但是扑克更复杂。扑克中有很多不确定的因素,例如,对手可能作弊,现实世界中作弊无处不在,而ai仍然不知道如何作弊。扑克玩家看不到对手的牌,但在国际象棋、国际象棋和围棋中,每个人都能清楚地看到对手的棋子。今年年初,由alphabet的子公司deepmind开发的人工智能程序击败了韩国著名的专业围棋大师李世石。
对于机器来说,无限期持有它们太难了。每手牌都有10的160次方(10后面跟着160个零)。迪普斯塔克通过和自己玩扑克不断学习。每次游戏后,系统都会修改优化策略来提高技能。由于无限制扑克的复杂性,该系统通过玩无限制扑克来提高其技能。为了解决复杂性问题,研究人员采用了快速逼近技术,将以前的扑克游戏数据输入到深度学习算法中,并不断优化和细化。
密歇根大学的威尔曼认为扑克是一种复杂的游戏。采用新技术后,系统能够有效应对各种情况,这是一个新的突破;以前,我们必须画整棵树,找出各种可能性。
研究人员将deepstack的方法技术与人类玩家的直觉进行了比较。当对手作弊或拿到一手可以赢的牌时,人类会用直觉来判断,例如,根据对手的语言。不同的机器根据对手的下注模式进行判断。研究人员说:“我们可以把这个估计看作是迪普斯塔克的直觉。”
通过观察扑克玩家在多次对抗中赢得的钱数,系统可以评估玩家的表现,而不是根据桌上的赌注来判断。与优秀的职业玩家相比,迪普斯塔克的胜率大约高出9倍。
2015年,波林和他在阿尔伯塔大学的同事找到了一个解决方案。他们开发的扑克机可以玩极限德州扑克,表现完美。参加匹兹堡锦标赛的机器人被称为“天平动”,它是由托马斯·桑霍尔姆和学生诺姆·布朗开发的。天平动在匹兹堡超级计算中心强大的硬件上运行。
标题:人工智能在德州扑克比赛中击败人类玩家
地址:http://www.aqh3.com/adeyw/5002.html