AI 研究人员的目标之一是弄清楚如何使机器学习模型更具可解释性,以便研究人员能够理解他们做出预测的原因。谷歌表示,这是对深度神经网络的预测的改进,而不是理解模型输出的原因。研究人员展示了如何构建一个能够分析烘焙食谱的可解释机器学习模型。
该机器学习模型可以开发自己的新的食谱,并且不需要数据的科学专业知识来建立模型。Sara Robinson 致力于 Google Cloud 的 AI。在大流行期间,她喜欢烘焙,并将她的人工智能技能转向了业余爱好。她首先收集了一组食谱数据,并构建了一个 TensorFlow 模型来吸收一系列成分并输出诸如“97% 的面包、2% 的蛋糕、1% 的饼干”之类的预测。
该模型能够准确地按类型对食谱进行分类,她用它来想出一个新的食谱。她的模型确定配方是 50% 的饼干和 50% 的蛋糕。它被称为蛋糕。罗宾逊说人工智能的食谱很好吃,尝起来就像她想象的如果她告诉人工智能制作混合蛋糕饼干会发生什么。
Robinson 与另一位研究人员合作,使用更大的数据集、新工具和可解释的模型构建了烘焙 2.0 模型,以深入了解蛋糕、饼干和面包的制作过程。该模型提出了一种名为“breakie”的新食谱,这是一种混合面包饼干。研究人员使用的数据集包括一份包含 16 种核心成分和 600 种食谱的洗衣清单。
作为预处理的最后一部分,研究人员使用了数据增强技巧。数据增强是一种从您已有的数据中创建新训练示例的方法。人工智能被设计成对食谱的份量不敏感,因此研究人员会随机将配料量增加一倍或三倍。
机器学习模型可以预测食谱类型并提供对话,允许研究人员命名模型、他们希望模型训练多长时间,并指示在训练中使用哪些输入特征。结果是一个模型能够预测正确给出的食谱的类别,并指定对其预测贡献最大的成分的重要性分数。