通过学习以与人类相同的方式偏离已知信息,人工智能(AI)的“成像”算法能够从书面说明中识别以前看不见的物体。
该算法由KAUST研究人员Mohamed Elhoseiny与中央佛罗里达大学的Mohamed Elfeki合作开发,为人工想象和对新动植物物种进行自动分类铺平了道路。
Elhoseiny解释说:“想象力是人类智力的关键特性之一,它使我们不仅能够产生艺术和音乐等创意产品,而且能够理解视觉世界。”
人工智能依靠训练数据来发展其识别物体并响应其环境的能力。人类也可以通过积累的经验来发展这种能力,但是人类可以做AI无法做到的事情。他们可以通过想象从书面描述中得出的东西看起来是什么样子,或者通过类似的推论来直观地推断出以前遇到的对象的可能分类。在AI中,随着技术被推广到复杂的实际应用中(其中新对象的错误分类或错误识别可能会造成灾难性的后果),这种想象未知的能力变得越来越重要。
同样重要的是可靠地为现实世界训练AI所需的大量数据。用AI甚至对全世界所有已知动植物物种的很小一部分的图像进行训练来进行AI训练是不可行的,更不用说无数未发现或未分类的物种了。
Elhoseiny和Elfeki的研究旨在开发所谓的零击学习(ZSL)算法,以基于没有培训示例的班级描述来帮助识别以前看不见的类别。
Elhoseiny表示:“我们通过将ZSL与人类创造力联系起来,为'看不见的'类别建立了视觉学习过程的模型,观察到ZSL是要识别看不见的事物,而创造力是要创造'可爱的看不见的事物,” Elhoseiny说。
在创造力方面,新颖但令人愉悦或“讨人喜欢”的事物必须与现有技术有所不同,但又应如此以至于无法辨认。以同样的方式,Elhoseiny和Elfeki仔细地建模了一个学习信号,该信号以归纳方式鼓励了与已见班级的背离,但并没有推得太远,以至于想象中的班级变得不切实际,并失去了已见班级的知识转移。所得算法显示出对ZSL最新基准的持续改进。
Elhoseiny说:“我们方法的可能应用之一是识别未知物种。”“采用这种技术的AI可以帮助报告物种的目击情况,而无需图片,只需带有语言描述即可。”