人工智能如何帮助科学家寻找新粒子?

  • 时间:
  • 浏览:2
  在搜寻新基本粒子的过程中,物理学家老是还要对粒子的行为作出假设,但新的机器学习算法却不用没法 做。

  9月13日消息,据国外媒体报道,大型强子对撞机(LHC)可不才能在一秒钟之内撞击十亿对质子。有时,这台巨大的机器因为会给现实世界带来惊喜,因为在少数碰撞中,会产生其他前所未有的东西。如可让,原先的惊喜并没哪些规律可言,物理学家并不确切知道要寻找哪些。他们担心,在将数十亿次碰撞所获得的数据梳理成更易管理的数字时,因为会无意中删掉物理学新理论的证据。在欧洲核子研究中心(CERN)参与超环面仪器(ATLAS)实验的纽约大学粒子物理学家凯尔·克兰默(Kyle Cranmer)说:“他们老是担心另一方会把婴儿和洗澡水一起去倒掉。”

  面对智能数据规约的挑战,其他物理学家尝试使用“淬硬层 神经网络”的机器学习技术来挖掘同类事件组成的数据海洋,寻找新的物理学现象。

  在初步使用案例中,淬硬层 神经网络通过研究少量标记为“猫”的图片和标记为“狗”的图片,学习如可区分猫和狗。然而,这俩法子 在寻找新粒子时并不适用,因为物理学家无法为机器提供他们从未见过的东西的图片。如可让,物理学家转而采用所谓的“弱监督学习”(weakly supervised learning)法子 ,即机器从已知粒子刚开始,利用细化的信息(比如总体上因为发生的频率)来寻找罕见事件。

  在今年5月份发表于科学预印本网站arxiv.org上的一篇论文中,三位研究人员提出应用相关策略对“撞击狩猎”(bump hunting)进行扩展。这俩经典的“粒子狩猎”技术曾用于希格斯玻色子的发现。美国劳伦斯伯克利国家实验室的研究者本·纳赫曼(Ben Nachman)表示,具体的思路是训练机器在数据集中寻找罕见的变化。

  试想一下,他们可不才能在猫狗实验的原理基础上做1个游戏:在充满北美森林观察记录的数据集中寻找新的动物物种。假设任何新的动物物种都倾向于聚集在某个特定的地理区域(与新粒子围绕某个特定质量的概念相对应),那算法就应该可不才能通过邻近区域的系统比较,将它们挑出来。因为加拿大不列颠哥伦比亚省刚好有113只驯鹿,美国华盛顿州有19只驯鹿(即使数据集富含数百万只松鼠),那tcp连接池池才能在没法 直接研究驯鹿的情况下,学好将驯鹿与松鼠区分开来。弱监督学习研究者、俄勒冈大学的理论粒子物理学家说:“这也有魔术,但感觉像魔术一样。”

  相比之下,粒子物理学中的传统搜索法子 通常要求研究人员对新现象是哪些样子做出假设。他们会创建1个描述新粒子行为的模型。类事,1个新粒子因为有衰变成一大群已知粒子的趋势。必须在定义了所要寻找的东西以前,他们才能设计出自定义的搜索策略。这项工作通常需共要1个博士研究生共要一年的时间,而纳赫曼认为,这俩过程可不才能完成得放慢、更彻底。

  有研究者提出了CWoLa算法,即无标签分类(Classification Without Labels),可不才能搜索任意未知粒子的现有数据,无论该粒子是衰变成1个类事型未知粒子,还是1个类事型或不类事型已知粒子。利用常规的搜索模型,LHC相互公司合作 机构因为还要共要20年时间来寻找后某种情况的因为性,而目前对前某种情况的搜索仍没法 任何结果。参与ATLAS项目的纳赫曼表示,CWoLa算法可不才能一次完成所哪些工作。

  其他实验粒子物理学家也认为,这将是1个很有价值的项目。在ATLAS项目中搜寻新粒子碰撞的物理学家凯特·帕查尔(Kate Pachal)说:“他们因为分析了其他可预测的区域,如可让接下来他们要刚开始填补哪些尚未分析的角落,这是一阵一阵要的1个方向。”去年,她和其他同事就在尝试设计某种灵活的软件,对一系列不同质量的粒子进行处理,但他们中没法 人对机器学习有足够的了解。“我要现在是尝试一下的以前了,”帕查尔说道。

  淬硬层 神经网络有希望在不有益于目前建模工作的数据中发现微妙的相关性。其他机器学习技术因为成功提高了LHC进行特定任务的下行带宽 ,比如识别由底夸克粒子产生的“喷注”。在这项工作中,物理学家毫无现象也会错过其他信号。加州大学欧文分校的粒子物理学家丹尼尔·怀特森(Daniel Whiteson)说:“他们把信息遗留在桌面上,而当你在1个机器上花了60 亿美元,你不用想把信息留在桌子上。”

  不过,机器学习虽然充满了tcp连接池池将手臂混淆为哑铃的警示故事(甚至还有更糟糕的情况)。对于LHC,他们担心机器学习的“捷径”最终反映的是LHC机器某种的各种小现象,而哪些现象正是实验物理学家努力你会忽视的。ATLAS项目的物理学家蒂尔·艾费特(Till Eifert)问道:“当你发现1个异常时,你虽然它是新物理学突破呢,还是探测器发生了哪些有意思的情况?”