机器学习算法可以在几分钟内击败世界上最困难的视频游戏,并且比几代物理学家的共同努力更快地解决复杂的方程式。但是传统算法仍然很难在繁忙的街道上选择停车标志。
对象识别继续阻碍机器学习的领域,特别是当图片是多维的和复杂的时,就像在高能物理实验中粒子检测器发生碰撞的那样。但是,新型的神经网络正在帮助这些模型提高其模式识别能力,并且该技术可能很快会在粒子物理实验中实施以优化数据分析。
今年夏天,费米实验室的物理学家在将图形神经网络嵌入到实验系统中的努力方面取得了进步。科学家Lindsey Gray更新了软件,使这些尖端算法可以部署在CERN的大型强子对撞机的数据上。这些网络将首次被集成到粒子物理实验中,以直接处理检测器数据-打开水闸以大幅提高效率,这将为当前和未来的检测器提供更精确的见解。
格雷说:“一周前只是研究的一个对象,如今已成为一种广泛使用的工具,可以改变我们分析粒子物理实验数据的能力。”
他的工作最初侧重于使用图神经网络分析大型强子对撞机CMS实验的数据,该实验是对撞机的四个主要粒子物理实验之一。
程序员开发了神经网络以筛选大量数据,以搜索特定的类别或数量,例如在拥挤的街道照片中的停车标志。
正常的数码照片实质上是由红色,绿色和蓝色正方形像素组成的巨大网格。经过训练以识别停车标志的样子后,经典的神经网络会检查整个像素块,以查看是否存在目标。但是,此方法效率不高,因为模型必须处理大量不相关的,混淆的数据。
计算机科学家开发了新型的神经网络来改善这一过程,但是算法仍然难以识别图像中的对象,而不仅仅是二维正方形像素网格。
以分子为例。为了确定化学物质是否有毒,化学家必须在分子内定位某些特征,例如碳环和羧基。用X射线色谱仪拍摄的化学药品照片会生成键合原子的3D图像,每次查看时它们看起来都略有不同。
由于数据未存储在正方形网格中,因此典型的神经网络很难学会识别有毒化合物。为了解决这个问题,化学家已经开始采用一套新的神经网络:图神经网络或GNN。
与这些典型的神经网络不同,即使GNN不在二维网格中,它们也能够分辨出哪些像素相互连接。通过利用数据“节点”之间的“边缘”(在这种情况下,原子之间的键),这些机器学习模型可以更有效地识别所需的主题。
Gray的愿景是将这些模型及其增强的目标识别功能简化用于粒子碰撞的数据处理。
“借助图谱神经网络,您可以编写一种更好的模式识别算法,以用于像粒子加速器数据这样复杂的事物,因为它能够查看所有输入数据之间的关系,从而找到其中最相关的部分。信息,”他说。
Gray的研究重点是将GNN应用于CMS检测器的高粒度热量计或HGCal。CMS每秒拍摄数十亿张高能碰撞图像,以寻找新粒子的证据。
量热仪的一个挑战是它收集了太多的数据(足够每秒容纳2000万部iPhone的照片),由于存储空间的限制,必须丢弃大部分数据。HGCal的触发系统必须在几分之一秒的时间内决定哪些数据有趣,应该保存。其余的将被删除。
“如果您有一个神经网络,您可以对其进行优化以在一定时间内运行,那么您可以更可靠地做出这些决策。您不会错过任何事情,也不会保留您真正不需要的东西”,另一位与Gray合作的Fermilab科学家Kevin Pedro说。
HGCal检测器同时收集有关粒子相互作用的许多不同信息,这会产生一些非常复杂的图像。
格雷说:“这些数据的形状很怪异,它们之间有随机的间隙,甚至还远未接近连续的正方形网格。” “这就是图表出现的地方,因为它们使您可以跳过所有无意义的内容。”
从理论上讲,将训练GNN分析感兴趣的像素之间的联系,并能够预测应保存哪些图像以及可以更高效,准确地删除哪些图像。但是,由于此类神经网络对于粒子物理学是如此新奇,因此尚无法将其直接实现到触发硬件中。
图神经网络以另一种方式非常适合HGCal:HGCal的模块是六边形的,这种几何形状虽然与其他类型的神经网络不兼容,但可以与GNN很好地配合使用。
Fermilab首席信息官Liz Sexton-Kennedy说:“这就是使这个特殊项目取得突破的原因。” “这显示了Kevin和Lindsey的独创性:他们与设计量热仪的同事紧密合作,并且利用他们在软件中的独特专业知识来进一步扩展实验的功能。”
Gray还设法编写了代码,扩展了PyTorch(一种广泛使用的开源机器学习框架)的功能,以允许在世界各地的设备上远程运行图神经网络模型。
格雷说:“在此之前,建立模型然后部署它是非常笨拙和and回的。” “现在,它已经可以正常工作了,您只需将数据发送到服务中,它就可以确定如何最好地执行数据,然后将输出发送回给您。”
Gray和Pedro表示,他们希望LHC的Run 3在2021年恢复运行时,图神经网络能够正常工作。这样,可以在对撞机的高发光度升级之前对模型进行训练和测试,其对撞机的增强的数据收集能力将使GNN成为可能。更有价值。
一旦网络在一个地方启动并运行,让它在实验室中的其他实验中工作应该会容易得多。
格雷说:“您仍然可以将我们正在学习的有关HGCal中图神经网络的所有相同内容应用于其他实验中的其他检测器。” “我们在高能物理中采用机器学习的速度还没有接近饱和。人们将继续寻找越来越多的方法来应用它。”