Facebook AI Research(FAIR)开发了一种新的AI,在与Hanabi对抗时产生了令人印象深刻的结果。新的发展是Facebook AI迈出的重要一步。
Hanabi是一款类似于纸牌的纸牌游戏。尽管大多数用于此技术的游戏(例如国际象棋或围棋)直接将AI置于人类面前,但Hanabi要求玩家相互合作以实现共同的目标。
Facebook雇用机器人在游戏中协同工作,直到它们超越了以前使用的AI系统。最新的最佳AI系统在游戏中获得25分的23.92分,而新的AI系统在25分中达到24.61分。
早在2月,Google,DeepMind,卡内基梅隆大学和牛津大学的研究人员提出了Hanabi基准测试。他们还包括创建能够玩游戏的其他AI,并将其称为“ AI研究的新领域”。
研究人员对新开发感到兴奋,因为用于帮助机器人的相同AI可能会在其他领域使用。一种可能的用途是改善虚拟助手与人互动的方式。
Facebook AI研究人员Noam Brown谈到了新的AI系统。
“与此相关的令人兴奋的事情之一是,我们正在观察到的改进实际上与深度强化学习所观察到的改进正交:您可以将其添加到任何策略之上,它将使它变得更加强大,鲍恩在接受采访时表示,他对VentureBeat进行了采访。“我们看到的结果远远超出了我们或其他研究人员的预期。实际上,我们从搜索中获得的收益要强于过去使用的所有深度强化学习算法所获得的收益。”
Facebook的AI的新发展是在研究人员不断开发能够与某些最复杂的游戏抗衡的软件的时候进行的。2016年,谷歌的DeepMind的AI系统击败了中国棋盘游戏Go中最出色的人类玩家。
Hanabi围绕团队合作和战略而建立,这是AI实现的重要里程碑,Hanabi现在被认为是测试AI的最佳游戏。在这种环境下使用时,人工智能可以改善并变得更加复杂。
Adam Lerer是Facebook研究人员,也是该论文的撰稿人。
他说:“我们转向这些合作游戏的原因之一是,我认为我们至少在竞争性游戏方面还没有剩下任何游戏。”
哈纳比(Hanabi)由两到五名球员组成的团队,每人随机获得一张牌。卡片的颜色不同且包含不同的数字,团队将它们按颜色和正确的数字顺序放在桌子上。
玩家看不到自己的牌,但队友可以看到。允许玩家给别人提示。例如,一个队友可以给出有关颜色的提示,从而导致另一个人玩或弃牌。
游戏中较复杂的方面之一是,玩家必须弄清楚线索及其含义。对于机器人来说,游戏的这一部分很难弄清他们所拥有的信息。