人工智能(AI)方法已成为许多地球科学领域(例如气候模型,天气预报,水文学,空间天气和固体地球)中的有用工具。人工智能方法正在用于卫星的预测,异常检测,事件分类和机载决策等任务,它们有可能为代表气候模型中的亚电网过程提供高速替代方案[Rasp等。,2018;Brenowitz和Bretherton,2019年]。
尽管近年来人工智能方法的使用急剧增加,但我们提醒您,应谨慎对待它们在地球科学中的使用,并伴随着最佳使用方法的发展。没有最佳实践,对这些方法的不当使用可能会导致“科学不佳”,从而可能在地球科学界普遍反对使用AI方法。这样的强烈反对将是不幸的,因为AI为地球科学家提供了很多服务,可以帮助他们筛选并从不断增加的数据量中获取新知识。因此,现在是地球科学界为使用AI开发周到的方法的时候了。
轻松获得强大的新方法
使用AI方法建立和运行实验,这些方法通常需要复杂的计算机科学知识。这已不再是这种情况。AI在其他领域的最新成功促使人们开发了非常易于学习和使用的免费高效的软件包。甚至可以用几行代码来建立复杂的人工神经网络,并且提供了无数教程和示例来指导新手用户。此外,随着算法变得更加高效,计算能力变得更便宜且云上的可用性更高,对高性能计算的访问不再是限制因素。所有这些发展为地球科学家们提供了强大的AI方法。
地球科学家在使用基于物理学的方法(例如动力学模型)和复杂的统计数据(例如经验正交函数分析和光谱分析)方面有着悠久的传统。因此,他们已经接受统计方法作为有用的工具,而统计方法是一种数据驱动的方法。但是,地球科学中AI方法(另一种数据驱动方法)的突然兴起,再加上地球科学家不熟悉的术语和文化,可能会使AI方法看起来比实际更陌生。AI只是提供了一组扩展的新数据驱动方法,其中许多方法都是从统计原理中衍生出来的。例如,一种基本类型的人工神经网络(深度学习)本质上是散布着标量非线性变换的一系列链接的线性回归模型。
在此,我们通过概述研究人员的一些建议步骤来解决如何最好地同时利用基于物理学和数据驱动方法的问题。为简洁起见,我们在下面仅使用术语“ AI方法”,尽管我们的大部分讨论同样适用于所有数据驱动的方法。
步骤1:提出指导性问题
我们建议地球科学家在选择特定的AI方法之前先问自己以下问题:
为什么我要在应用程序中使用AI?该应用程序是用于预测,理解还是两者兼有?答案对于选择满足透明度和性能之间所需折衷的AI方法很重要。
如何将科学知识整合到AI方法中?有很多方法可以将基础物理过程(例如物理和化学)和AI方法的专家科学知识相结合;应该尽一切努力合并这些方法,如下面第2步中所述。
可以使用可解释的AI中的哪些工具?可解释的AI(XAI)的新兴领域为AI方法的可视化和解释提供了许多新工具[Samek等。,2019]。McGovern等。例如,[2019]展示了这些工具在与天气相关的应用中的巨大潜力。这些工具有可能通过增加透明度并由此建立对其推理的信任来改变AI方法在地球科学中的使用。
我的方法是否能概括性地解决使用它的所有条件?AI方法依靠“训练数据”来学习系统的特征。必须特别注意测试,并确保生成的AI模型在不断变化的条件(包括政权转移)下工作。融合科学知识可以大大增强泛化能力,并且可以通过从交叉验证到生成对抗性示例的AI技术等方法进行测试。
我的方法可重复吗?我是否遵循可发现,可访问,可互操作和可重用(FAIR)的数据原理?我的方法是否易于社区使用?