卡内基梅隆大学人工智能系统Libratus在长达20天的鏖战中,打败4名世界顶级德州扑克玩家,这标志着人工智能技术又达到了一个新的高峰。
在国际象棋之后,机器人相继在Jeopardy和围棋游戏上打败人类,人类唯一领先的,就是扑克了。
在一次长达20天的德州扑克大赛上,卡内基梅隆大学开发的人工智能系统打败了4名世界顶级的专业德扑玩家,赢得1,766,250美元筹码。
这据称是人类与机器不断角力道路上的一个新里程碑,人工智能首次以大赌注策略击败了它的人类对手。
卡内基梅隆大学的计算机教授图奥马斯·桑德霍姆(Tuomas Sandholm)称,扑克是人类防守智能机器在游戏领域节节胜利的“最后一道防线”。机器打败人类的首例,要追溯到20年前国际象棋大师加里·卡斯帕罗夫(Garry Kasparov)被IBM的超级电脑击败。
谷歌(微博)旗下的DeepMind,在英国赞助下开发出最顶尖的人工智能系统,去年开发的一款程序赢了围棋比赛,这被称为是对思维延伸策略游戏的终极测试。
但是,扑克检测的是不同的脑部区域,因为它涉及利用不完整信息做战略决策,而这也更贴近现实世界。
“这也不仅仅是扑克。我们开发的算法…可以处理任何不完整信息的情况,并依此做出最好的策略,” 桑德霍姆先生说,他和博士生诺姆·布朗(Noam Brown)共同开发了这个系统。
这个技术可以应用在各个领域与人类竞争,比如商业谈判、军事战略和大型银行使用的高频交易系统,他说。
这个叫做Libratus的人工智能系统,每天10小时连续三周玩扑克中最有挑战性的不限注德州扑克。它起初的表现让人类觉得有希望最终获胜。但是,系统逐渐补救了战术中的漏洞,最终如桑德霍姆描述为“系统大举获胜,结果很显著”。
“比赛到一半的时候,我们真的以为要赢了,”其中一位专业玩家丹尼尔· 麦考利(Daniel McAulay)说。“我们真的有机会打败它。”
卡内基梅隆大学团队每晚用超级电脑来分析白天的比赛,提高系统性能。系统检测自身在每轮比赛中的弱点,每天补救三个最明显的失误,而不是试图学习对手的制胜战术。
这个方法最终使其出其不意用大赌注智胜它的对手,桑德霍姆称之为系统相对人类“心理承受能力”的优势。
相对其它玩扑克的程序,Libratus最主要的提高在于电脑在接近游戏最后时的玩法。先前的系统从头至尾使用单一战术,但是Libratus使用额外的反馈回路来实时回应对桌的人类。
“我们用了所有能想到的办法,它实在是太强大了,”另一位扑克玩家杰森·莱斯(Jason Les)说。“它每天的出现都让我们士气低落,最后输的这么惨。我以为我们最后的筹码会非常接近。”
桑德霍姆说,几乎可以肯定要单独成立一家新的创业公司,用Libratus背后的技术来开发商业用途。他已经研究了27年的谈判策略。他早先开发过的一款程序被2/3的美国器官移植中心使用来决定哪位病人可以得到新肾的移植。