迄今为止,教导机器人执行任务通常涉及直接编码,反复试验或手持机器。但是很快,您可能只需要像前一天一样执行该任务。麻省理工学院的科学家们开发了一个系统,即“不确定规格计划”(PUnS),该系统可以帮助机器人学习复杂的任务,否则他们会遇到麻烦,例如设置餐桌。PUnS代替了机器人因执行正确的动作而获得奖励的通常方法,而是让机器人对各种规格持有“信念”,并使用一种语言(线性时态逻辑)让其推理现在要做的事情并在未来。
为了将机器人推向正确的结果,团队设定了有助于机器人满足其整体信念的标准。这些标准可以满足概率最高,公式数量最多,甚至失败几率最小的公式。如果使用危险材料,设计人员可以优化机器人的安全性;如果是工厂模型,设计人员可以优化其质量。
MIT的系统在早期测试中比传统方法有效得多。基于PUnS的机器人在设置桌子的20,000次尝试中仅犯了6个错误,即使研究人员出现了诸如隐藏叉子之类的麻烦时,自动机也完成了其余任务,并在弹出时回到了叉子。这样,它表现出了类似人的能力,可以设定明确的总体目标和即兴创作。
开发人员最终希望该系统不仅可以通过观看来学习,还可以对反馈做出反应。例如,您可以对其进行口头更正或对其性能进行批评。这将涉及更多工作,但它暗示着家用机器人可以通过树立榜样来适应新职责的未来。