您的位置:首页>科技>

亚马逊正在使用AI和机器学习来根据客户的查询预测上下文

亚马逊正在使用AI和机器学习来根据客户的查询预测上下文。在预定于本月举行的ACM SIGIR人类信息交互与检索会议上接受的预印本中,亚马逊研究人员描述了一种系统,该系统可根据“阿迪达斯男式裤子”等查询来预测“跑步”等活动。它可以帮助提高Amazon.com上搜索结果的质量,从而可以改善整体Amazon购物体验。

正如特约作者兼Amazon Search客户体验应用科学家Adrian Boteanu在博客文章中解释的那样,大多数产品发现算法都在查询和产品之间寻找关联。相比之下,研究人员的AI根据使用情况确定最佳匹配项。

为了对系统进行培训,团队根据通用产品汇总了173种使用环境类别的列表,分为112种活动(例如阅读,清洁和跑步)和61位受众(例如孩子,女儿,男人和专业人员)查询。他们使用标准参考文本为用于表示类别的术语创建别名,然后搜寻与数百万种产品相关的语料库,以查询字符串以查看类别术语及其别名的评论。如果在给定产品的任何评论中出现了原始类别术语或别名,则该产品将标记有相应的类别术语。

上述语料库根据亲和力得分(从1到15)将字符串与产品相关联,其中低得分表示弱相关性。为了训练使用上下文的预测器,研究人员生成了另一个数据集,其中每个条目都包含三个数据项:查询;产品ID,使用上下文类别进行注释;以及查询产品亲和力得分。该数据集被分为两个较小的集合,一个根据活动进行注释,另一个根据受众进行注释,用于训练六个不同的机器学习模型。

每个模型都经过培训,可以根据查询字符串预测使用环境,在测试中,效果最好的模型可以预测产品注释,其中活动类别的准确性为97%,受众类别的准确性为92%。当向人类审阅者显示由活动模型生成的类别的按等级排序的列表时,审阅者同意平均81%的时间接受系统的逐项预测。

“这表明我们的系统确定的使用环境可以帮助产品发现算法提供更相关的结果,从而改善客户体验。此外,生成培训数据所需的最低限度的人力监督意味着我们的方法可以以相对较少的努力扩展到新的类别,”博客文章说。

免责声明:本文由用户上传,如有侵权请联系删除!