2023-08-02 16:10
粒子物理学家们正在创建新型机器学习算法,利用AI(人工智能)的力量增强蒙特卡罗模拟。蒙特卡罗模拟最初是由研究中子扩散的物理学家们,在近一个世纪前提出的,它是一种使用随机数来模拟不同事件的数学模型。
举个简单的例子,假设你有一对六面骰子,你想确定骰子落在任何给定数字上的概率,就需要蒙特卡罗模拟。澳大利亚伍伦贡大学的物理学副教授苏珊娜·瓜泰利表示:“就像你拿起骰子,重复同样的练习,把骰子扔到桌子上,然后看看结果。”
通过重复掷骰子实验并记录骰子落在每个数字上的次数,就可以建立一个 "概率分布"——一个给出骰子落在每种可能结果上的可能性的列表。
对于物理学中使用的蒙特卡罗模拟,"当我们用它来解决问题时,我们必须重复同样的实验很多很多次,当然,这比掷骰子要困难得多,也复杂得多。"瓜泰利说道。
与宇宙本身一样,蒙特卡罗模拟也受随机性和偶然性的支配。这使它们非常适合模拟自然系统。美国能源部劳伦斯伯克利国家实验室的资深科学家本杰明·纳赫曼表示:"蒙特卡罗模拟基本上就是我们模拟自然的方式。"
粒子物理学家使用蒙特卡罗模拟来设计新的实验,规划设备的构造,并预测设备的性能。在研究人员进行实验后,他们使用蒙特卡罗模拟来设计他们的分析,模拟粒子物理学标准模型预测的物理过程和超出标准模型的假设过程,以了解如果它们发生的话会是什么样子。
蒙特卡罗模拟变得如此有用的一个原因是,它现在比过去准确得多。
费米国家加速器实验室的科学家凯文·佩德罗说:“我们从事高能物理研究的人几乎所有事情都依赖蒙特卡罗模拟,这实际上是一个相对较新的发展。在前几代实验中,蒙特卡罗工具的准确性要低得多,所以人们不那么信任它们……但在上世纪90年代和21世纪初,人们做了很多工作来提高准确性?!?br />
蒙卡模拟得到机器学习的提升
蒙特卡罗模拟允许研究人员分析与一些独立变量相关的事件,如时间或能量。
纳赫曼表示:“物理过程或任何过程的定义特征之一,就是不同的过程发生在不同的时间、能量或长度尺度上。所以我们的想法是,在一些模拟器中有一些粒子或者物体的基本单位,跟踪这些粒子随着时间、能量或任何相关独立量的变化?!?br />
最终的结果是实验数据的数学模拟,看起来很像真实的东西。纳赫曼表示:“我们希望能够模拟一些数据集,这应该看起来与我们在一些实验中看到的数据尽可能相似。”
但是这种蒙特卡罗模拟方法也有其局限性。佩德罗表示:“虽然非常准确,但速度有点慢。”
对于研究人员来说,是否能够在他们想要建模的过程中模拟足够多的单个事件,从而使最终的模拟具有与真实实验数据相同的统计能力,这始终是一个悬而未决的问题。
“这就是人工智能的用武之地。”佩德罗说道。
例如,在对撞机实验中,由于每个应用程序的所有细节,模拟速度很慢。粒子穿过探测器,研究人员模拟它们与探测器材料的相互作用。然而,粒子的任何运动都会引起探测器材料的变化,以及正在发生的相互作用类型的变化。
这意味着不仅是输入,模拟所需的实际计算也会随着每一步的计算而变化。每个粒子本质上都想做一些不同的事情,这种复杂性对现代计算机来说是一个挑战。
“但如果只看(最终结果)……我们的想法是,可以训练某种人工智能算法,以此将可以非常准确地重现这种分布。这将以一种非常容易的方式在现代计算架构上做到加速运算?!?span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;font-size: 15px;visibility: visible;">佩德罗表示。
换句话说,研究人员通过用机器学习模型取代部分或全部缓慢的粒子探测器模拟来加速实验。他们用真实探测器实验的数据训练这些模型,甚至用以前模拟的数据训练模型。这个框架也适用于粒子物理的许多其他领域,这不仅可以提高模拟的速度,还可以提高模拟的准确性。
佩德罗表示:“基本的想法(总是)或多或少是相似的——如果足够小心的话,有一些计算密集型的任务,可以用人工智能算法近似到非常高的保真度?!?br />
需要更好的机器学习模型吗?
当然,就像蒙特卡罗方法有其局限性一样,物理学家们用来加速机器学习模型也有其局限性。在某种程度上,这是因为许多机器学习方法都来自行业研究,而这些行业的数据集截然不同,而且可以说不那么复杂。
佩德罗表示:“在行业人工智能研究中,他们倾向于研究文本、图像和视频。”
这些人为创建的数据格式通常具有简单、规则的结构。句子是单词的序列,图像是像素的网格。视频是一系列的像素网格。
佩德罗表示:“我们在粒子物理学中获得的数据有其自身的规律,但数据片段之间的关系要复杂得多。通常情况下,这几乎就是整个问题,只能试图让现有的人工智能以一种合理的方式有效地处理我们的数据?!?br />
因此,像佩德罗这样的研究人员有时会发现,他们从工业界借鉴人工智能和机器学习的这些方法,甚至在他们能够解决的问题的规?;蚋丛有苑矫娉搅舜车募扑慊蒲а芯?。
佩德罗提到了一些来自不同物理研究领域的例子,包括2021年的一篇论文。在这篇文章中,一群研究粒子射流模拟的高能物理学家开发了一种新的机器学习模型,称为生成对抗网络(GAN)。研究人员声称,现有的GAN“不足以用于物理应用”。
通过对这些模型进行微小的调整,他们能够开发出一种新的GAN,这种GAN在每个指标上都能提供更好的定量结果。
虽然将人工智能方法与物理应用相结合有很多好处,但物理学家们在处理机器学习算法本身的黑箱性质时,也面临着一系列新的挑战。
机器学习算法通常擅长建立能够生成正确答案的内部模型,但不擅长连贯地解释这些模型是什么,或者为什么算法会得出这样的结果。工业界和科学界的人工智能研究人员仍在努力定义这个“可解释性”问题的全部范围,尽管一些人认为这是一个特别紧迫的科学应用主题。
佩德罗表示:“这就像是我们在试图了解宇宙。怎么让一个AI算法以你能理解的方式告诉你,它所计算出结果的推导过程?这也是一个非常开放的问题。”
来源 | 《Symmetry》期刊官网
编译 | ?槟榔郭
2025-08-22
2025-07-22
2025-07-11
2025-07-03
2025-04-15
2025-04-15
2025-04-15
2025-04-15