在即将举行的MineRL竞赛中,AI工程师,研究人员等将获得4天的时间来开发能够通过挖掘在流行的Minecraft游戏中找到钻石的AI。问题在于参与者将有800万步训练他们创建的AI来寻找钻石。这比目前训练AI模型所需的时间短。因此,参与者必须提出新的工程解决方案才能完成任务。
在最近的比赛中,人工智能在战略游戏《星际争霸2》中击败了人类。为了提高挑战水平,现在需要AI在Minecraft中完成任务。《星际争霸II》有明确的目标,可以分解为合理的步骤,然后将其用于训练AI程序。另一方面,《我的世界》是一款大型的开放世界的沙盒游戏,要分解成清晰合理的步骤要困难得多。因此,为Minecraft训练AI程序要复杂得多。培训步骤的上限为800万,从而增加了复杂性。
目前,用于AI的培训方法是强化学习。工厂中的机械臂通过这种方法进行训练。强化学习需要大量的计算机处理能力来进行训练,其中数千台计算机被链接在一起进行学习。
为了克服强化学习的缺点,研究人员正在开发模仿学习系统,在该系统中训练AI程序以模仿人类通过观察进行学习的行为。
选择Minecraft是因为它很受欢迎,因为培训数据很容易获得。实际上,组织者招募了Minecraft玩家来创建各种工具并打破常规。收集了超过6000万个可以在游戏中采取的动作示例,这些视频可以播放1000小时的视频。所有这些都移交给了参与者以培训他们的AI。
Minecraft允许玩家从简单的构建块中构建复杂的结构。创建结构的过程可以分解为不同的阶段,参与者可以将其用作进度的标记。
模仿学习将使AI能够吸收所有数据,在其中寻找模式,并对游戏做出一些假设,这将构成其知识的基线。