在当今世界,没有人工智能的日常生活几乎是不可想象的。自动驾驶,外语翻译或医学诊断等领域的无数应用已进入我们的生活。在化学研究中,也正在努力有效地应用人工智能(AI),也称为机器学习。这些技术已经用于预测单个分子的特性,从而使研究人员更容易选择要生产的化合物。
这种生产称为合成,通常涉及相当大的努力,因为存在许多可能的合成途径来生产靶分子。由于每个反应的成功取决于许多参数,因此即使对于有经验的化学家来说,也不总是能够预测反应是否会发生,甚至无法预测反应的进行情况。为了解决这种情况,来自明斯特大学(德国)的化学家和计算机科学家团队共同努力,开发了一种AI工具,该工具现已发表在《化学》杂志上。
背景与方法:
“化学反应是一个高度复杂的系统,”有机化学研究所的博士生,该出版物的主要作者之一弗雷德里克·桑福德解释说。他补充说:“与预测单个化合物性质相反,反应是许多分子的相互作用,因此是一个多维问题。”而且,没有明确定义的“游戏规则”,就像现代国际象棋计算机一样,它可以简化AI模型的开发。因此,以前准确预测反应结果(例如产率或产物)的方法主要基于对分子特性的先前了解。“开发这种模型需要大量的努力。此外,
因此,提出的工作重点是该程序的普遍适用性,以便其他化学家可以轻松地将其用于自己的工作。为了确保这一点,该模型直接基于分子结构。“每个有机化合物都可以用图形表示,原则上可以用图像表示,”计算机科学领域的另一位作者MariusKühnemund解释说。“在这样的图形上,可以进行简单的结构查询(与照片中的颜色或形状问题类似),以便尽可能准确地捕获所谓的化学环境。”
许多这样的连续查询的组合产生了所谓的分子指纹。这些简单的数字序列长期以来一直用于化学信息学中,以发现结构相似之处,非常适合计算机辅助应用。在他们的方法中,作者使用了大量的此类指纹来尽可能准确地表示每个分子的化学结构。MariusKühnemund补充说:“通过这种方式,我们已经能够开发出可用于预测完全不同的反应结果的强大系统,同一模型可用于预测产量和立体选择性,这是独一无二的。”
作者证明,他们的程序可以很容易地应用,并且可以通过使用最初不是为机器学习创建的数据集来进行准确的预测,尤其是与现代机器人技术结合使用时。Frederik Sandfort解释说:“该数据集仅包含原材料的相对销售量,而没有确切的产量。”“要获得准确的产量,就必须创建校准。但是,由于涉及的工作量很大,实际上很少这样做。”
该团队将继续开发其程序,并在将来为其配备新功能。Frank Glorius教授充满信心:“在评估大量复杂数据时,计算机在根本上优于我们。但是,我们的目标不是用机器代替合成化学家,而是尽可能有效地支持它们。基于模型人工智能可以极大地改变我们进行化学合成的方式。但我们仍处于起步阶段。”