近日,位于欧洲核子研究中心(CERN)的大型强子对撞机(LHC)是目前世界上最大的粒子加速器,在里面进行的实验每秒产生大约一百万吉字节(GB,十亿字节)的数据。即使经过压缩,LHC在一小时内积累的数据也与社交网站脸书整年收集的数据量相当。
这么海量的数据,给存储和分析带来了极大难题。幸运的是,粒子物理学家不必自己处理所有这些数据。他们与一种称为机器学习的人工智能(AI)携手合作,来处理这些数据。
机器学习筛查大数据
机器学习已被证明在分析领域非常成功。为了处理像在LHC内进行的那些现代实验中产生的海量数据,研究人员应用所谓的“触发器”——专用的硬件和软件,它们能实时决定哪些数据可保存下来以供分析,哪些数据可以丢弃。
论文作者之一、麻省理工学院的迈克·威廉姆斯说,机器学习算法至少可由做出其中70%的决定。威廉姆斯目前正参与LHCb实验,该实验可帮助科学家揭示为何宇宙中物质的数量远远多于反物质的数量。
LHC中巨大的超环面仪器(ATLAS)与紧凑渺子线圈(CMS)能发现希格斯玻色子,每个探测器都有数百万个传感元件,其信号需要放在一起才能获得有意义的结果。SLAC的迈克尔·卡根说道:“这些信号组成了一个复杂的数据空间,我们需要了解它们之间的关系,得出结论,例如,探测器中某个粒子的轨迹是由电子、光子还是其他东西产生。”
中微子实验也受益于机器学习。NOVA研究了中微子在穿越地球时如何从一种类型转变为另一种类型,这些中微子振荡可能潜在地揭示一种新类型中微子的存在,一些理论认为,这种中微子是暗物质的粒子。NOVA的探测器正在监视中微子撞击探测器材料时产生的带电粒子,并且,机器学习算法可以识别它们。
识别特征 进行模拟
机器学习算法日益复杂和精细,为解决粒子物理问题开辟了前所未有的机会。机器学习的最新发展——所谓的深度学习,即使用神经网络,改进了粒子物理学家们的实验方式。
卡根说,他们可以使用深度学习的许多新任务都与计算机视觉有关,“它与面部识别相似,只是在粒子物理学中,图像特征比耳朵和鼻子更抽象。”
像NOVA这类实验产生的数据很容易转化为实际图像,AI可以很容易地从中识别特征。拉多维奇说:“即使数据看起来不像图像,如果能够以正确的方式处理数据,我们仍然可以使用计算机视觉方法。这种方法非常有用的一个领域是,对大型强子对撞机产生的大量粒子射流进行分析。”
深度学习的另一个新兴应用是粒子物理学数据的模拟,如预测LHC中的粒子碰撞会发生什么,并与实际数据比较。传统模拟通常很慢且需要巨大的计算能力,而AI可以更快地进行模拟。
卡根说:“虽然这是非常早期的工作,但它显示出许多希望,并可能有助于应对未来的数据挑战。”
质疑促进进步
尽管有明显进步,但机器学习爱好者经常需要面对来自合作伙伴的质疑,部分原因是机器学习算法大多数时候就像“黑匣子”,很少能提供关于它们如何得出某个结论的信息。
今天我们主要使用机器学习来查找数据中的特征,10年后,机器学习算法或许可以独立地提出问题,并在发现新物理学时识别它们。”
声明: 本网站原创内容,如需转载,请注明出处;本网站转载内容(文章、图片、视频等资料)的版权归原网站所有。如我们转载或使用了您的文章或图片等资料的,未能及时和您沟通确认的,请第一时间通知我们,以便我们第一时间采取相应措施,避免给双方造成不必要的经济损失或其他侵权责任。如您未通知我们,我们有权利免于承担任何责任。 我们的联系邮箱:news@cecb2b.com。
中发电子2025乙巳蛇年春节放假通知来啦