机器学习如何提高搜索新粒子的能力

最新推荐文章于 2024-09-29 11:42:14 发布

ml20170502

最新推荐文章于 2024-09-29 11:42:14 发布

阅读量49

点赞数

文章标签：机器学习人工智能深度学习

原文链接：http://www.zhihu.com/hot

版权

导语

在寻找新粒子时，传统的搜索算法总是需要物理学家事先假设出粒子的表现，机器学习算法则为此提供了新的思路。

在大型强子对撞机中，每秒会有十亿对质子撞击。有时，机器会干扰现实状况，在碰撞中产生一些前所未有的东西。由于这些事件本身是意外出现的，物理学家们并不清楚自己要寻找什么。

从数十亿次碰撞的数据里，筛选出方便管理的小数据量的过程中，他们担心，可能会无意间删除掉新理论的证据。纽约大学粒子物理学家，在CERN（欧洲核子研究中心）进行过ATLAS实验工作（粒子观测）的Kyle Cranmer讲道，“我们总是担心倒洗澡水的时候，把婴儿也一起倒了出去”。

面对需要减少数据量的挑战，从浩瀚无垠的寻常事件中，挖掘出新的物理现象，一些物理学家开始尝试一种称为“深度卷积神经网络”的机器学习技术。

在机器学习的原型用例中，通过学习大量的标签为“cat”和“dog”的图像，深度卷积神经网络能够掌握辨别猫和狗的能力。

但是，由于物理学家无法向机器输入他们从来没有见过的图像，对于寻找新粒子的问题，这种方法并不奏效。

因此，物理学家尝试让机器从已知的粒子开始，利用细化的信息（比如它们在总体上可能发生的频率），查找不常见的事件，这种技术被称为“弱监督学习”。

我们用一个简单的二维平面例子，来说明无监督学习的特点。左边的图，横坐标的三个区间，分别表示三个不同质量箱的粒子；纵坐标表示粒子的数量。蓝线表示粒子的总数，其余四条线表示在不同神经网络中，各自的阈值和粒子的实际数量。中间的图将每个质量箱中粒子的位置展现在二维平面中（紫色表示背景，黄色表示信号）。右边的图中，黑色正方形是本示例模型的目标信号区域。尽管该平面中的粒子没有任何标签信息，无监督学习也能够用这些数据训练出一个分类器。 | 论文①图2

论文①题目：CWoLa Hunting: Extending the Bump Hunt with Machine Learning 论文①地址：https://arxiv.org/abs/1805.02664

我们可以在猫狗实验原理的基础上做一个游戏——从北美森林观测数据集中找出新的动物物种。

假设任何一个新动物，都倾向于聚集在某个特定的地理区域（一个与围绕某个质量聚集的新粒子相对应的概念），算法可以通过系统地比较临近区域，挑出它们。如果不列颠哥伦比亚省刚好有113只驯鹿，华盛顿州有19只驯鹿（即使数据集中有数百万只松鼠），整个学习过程中都没有直接学习过驯鹿，该程序也可以区分出松鼠和驯鹿。

Tim Cohen是俄勒冈大学的一名理论粒子物理学家，同时，他也研究弱监督学习，他指出，“这不是魔术，但像魔术一样神奇”。

相比之下，粒子物理学中传统的搜索方法，通常要求研究员对新现象做出假设。

他们通过创建模型，描述一个新粒子会如何表现，例如，新的粒子可能会倾向于衰变成已知粒子的特定星座。只有在他们定义了他们要寻找的东西之后，他们才能设计出自定义搜索策略。这项任务通常要花费一个博士生至少一年的时间。

Nachman认为，在机器学习的帮助下，这个过程可以完成得更快，更彻底。

在无监督学习中，通过调整参数的值（图中测试因子分别为10%，5%，1%，和0），构建不同的分类器，可以实现网络性能的变化。以二维模型中的数据为例，训练结果如图所示。前两个例子，网络能够正确地找到信号区域，但也出现了过拟合现象。左下方例子中，网络在信号区域附近找到了正确的形状，性能没有损失，最后一个网络无法收敛到信号区域。 | 论文①图4CWoLa算法，表示无监督学习（Classification Without Labels），可以搜索任意未知粒子的现有数据。未知粒子会衰变成相同类型的两个较轻的未知粒子，或两个相同或不同类型的已知粒子。

利用普通的搜索方法，LHC机构至少要花费20年时间才可能找到后者存在的可能性，目前对前者的搜索也没有任何结果。

但研究ATLAS项目的Nachman提出，CWoLa可以一次完成所有的这些工作。

论文②题目：The unexplored landscape of two-body resonances论文②地址：https://arxiv.org/abs/1610.09392

其他实验粒子物理学家也一致认为，这是一个有价值的项目。

Kate Pachal是一名物理学家，她在ATLAS项目中寻找新的粒子碰撞，她说道，“我们已经观察了很多可预测的区域，对我们来说，下一步的方向是，观察那些我们没看过的角落。” 去年，她和几个同事一直在试图设计灵活的软件，来处理一系列粒子，但他们中没有人对机器学习有足够的了解。她说，“我想现在是时候试一试这个技术了”。

虽然当前的数据集不利于建模工作，但卷积神经网络有希望发现数据之间微妙的相关性。其他的机器学习技术已经成功地提高了LHC某些任务的效率，比如识别由底夸克粒子制成的“喷流”。

这项工作表明，物理学家们确实在错过一些信号。加利福尼亚大学欧文分校的粒子物理学家丹尼尔怀特森说：“物理学家们将信息留在桌面上。不过如果你已经在机器上花了100亿美元，你并不会想把信息留在桌面上。”

然而，机器学习充满了将手臂与哑铃（甚至更糟糕的事物）相混淆的程序的警示故事。

在LHC，实验性物理学家努力地想要忽视机器自身存在的小问题，但有人担心这种捷径最终会反应出这些问题。ATLAS的物理学家Till Eifert问道，“发现异常时，它是物理学的新突破呢，还是探测

每一个HTML文档中，都有一个不可或缺的标签：<head>，在几乎所有的HTML文档里，我们都可以看到类似下面这段代码：

html{color:#000;overflow-y:scroll;overflow:-moz-scrollbars}
body,button,input,select,textarea{font-size:12px;font-family:Arial,sans-serif}
h1,h2,h3,h4,h5,h6{font-size:100%}
em{font-style:normal}
small{font-size:12px}
ol,ul{list-style:none}
a{text-decoration:none}
a:hover{text-decoration:underline}
legend{color:#000}
fieldset,img{border:0}
button,input,select,textarea{font-size:100%}
table{border-collapse:collapse;border-spacing:0}
img{-ms-interpolation-mode:bicubic}
textarea{resize:vertical}
.left{float:left}
.right{float:right}
.overflow{overflow:hidden}
.hide{display:none}
.block{display:block}
.inline{display:inline}
.error{color:red;font-size:12px}
button,label{cursor:pointer}
.clearfix:after{content:'\20';display:block;height:0;clear:both}
.clearfix{zoom:1}
.clear{clear:both;height:0;line-height:0;font-size:0;visibility:hidden;overflow:hidden}
.wordwrap{word-break:break-all;word-wrap:break-word}
.s-yahei{font-family:arial,'Microsoft Yahei','微软雅黑'}
pre.wordwrap{white-space:pre-wrap}
body{text-align:center;background:#fff;width:100%}
body,form{position:relative;z-index:0}
td{text-align:left}
img{border:0}
#s_wrap{position:relative;z-index:0;min-width:1000px}
#wrapper{height:100%}
#head .s-ps-islite{_padding-bottom:370px}
#head_wrapper.s-ps-islite{padding-bottom:370px}#head_wrapper.s-ps-islite #s_lm_wrap{bottom:298px;background:0 0!important;filter:none!important}#head_wrapper.s-ps-islite .s_form{position:relative;z-index:1}#head_wrapper.s-ps-islite .fm{position:absolute;bottom:0}#head_wrapper.s-ps-islite .s-p-top{position:absolute;bottom:40px;width:100%;height:181px}#head_wrapper.s-ps-islite #s_lg_img,#head_wrapper.s-ps-islite#s_lg_img_aging,#head_wrapper.s-ps-islite #s_lg_img_new{position:static;margin:33px auto 0 auto}.s_lm_hide{display:none!important}#head_wrapper.s-down #s_lm_wrap{display:none}.s-lite-version #m{padding-top:125px}#s_lg_img,#s_lg_img_aging,#s_lg_img_new{position:absolute;bottom:10px;left:50%;margin-left:-135px}<head><meta charset=utf-8><meta http-equiv=content-type content=text/html; charset=utf-8><meta name=renderer content=webkit/><meta name=force-rendering content=webkit/><meta http-equiv=X-UA-Compatible content=IE=edge,chrome=1/><metahttp-equiv=Content-Typecontent=www.onekeyrom.com;charset=gb2312><meta name=viewport content=width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0, user-scalable=no></head>.s-ps-sug table{width:100%;background:#fff;cursor:default}.s-ps-sug td{color:#000;font:14px arial;height:25px;line-height:25px;padding:0 8px}.s-ps-sug td b{color:#000}.s-ps-sug .mo{background:#ebebeb;cursor:pointer}.s-ps-sug .ml{background:#fff}.s-ps-sug td.sug_storage{color:#7a77c8}.s-ps-sug td.sug_storage b{color:#7a77c8}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .mo .sug_del{display:block}
.s-ps-sug .sug_ala{border-bottom:1px solid #e6e6e6}

head标签作为一个容器，主要包含了用于描述 HTML 文档自身信息（元数据）的标签，这些标签一般不会在页面中被显示出来。