机器学习如何提高搜索新粒子的能力

导语

在寻找新粒子时,传统的搜索算法总是需要物理学家事先假设出粒子的表现,机器学习算法则为此提供了新的思路。

在大型强子对撞机中,每秒会有十亿对质子撞击。有时,机器会干扰现实状况,在碰撞中产生一些前所未有的东西。由于这些事件本身是意外出现的,物理学家们并不清楚自己要寻找什么。

从数十亿次碰撞的数据里,筛选出方便管理的小数据量的过程中,他们担心,可能会无意间删除掉新理论的证据。纽约大学粒子物理学家,在CERN(欧洲核子研究中心)进行过ATLAS实验工作(粒子观测)的Kyle Cranmer讲道,“我们总是担心倒洗澡水的时候,把婴儿也一起倒了出去”。

面对需要减少数据量的挑战,从浩瀚无垠的寻常事件中,挖掘出新的物理现象,一些物理学家开始尝试一种称为“深度卷积神经网络”的机器学习技术。

在机器学习的原型用例中,通过学习大量的标签为“cat”和“dog”的图像,深度卷积神经网络能够掌握辨别猫和狗的能力。

但是,由于物理学家无法向机器输入他们从来没有见过的图像,对于寻找新粒子的问题,这种方法并不奏效。

因此,物理学家尝试让机器从已知的粒子开始,利用细化的信息(比如它们在总体上可能发生的频率),查找不常见的事件 ,这种技术被称为“弱监督学习”

我们用一个简单的二维平面例子,来说明无监督学习的特点。左边的图,横坐标的三个区间,分别表示三个不同质量箱的粒子;纵坐标表示粒子的数量。蓝线表示粒子的总数,其余四条线表示在不同神经网络中,各自的阈值和粒子的实际数量。中间的图将每个质量箱中粒子的位置展现在二维平面中(紫色表示背景,黄色表示信号)。右边的图中,黑色正方形是本示例模型的目标信号区域。尽管该平面中的粒子没有任何标签信息,无监督学习也能够用这些数据训练出一个分类器。 | 论文①图2

论文①题目:CWoLa Hunting: Extending the Bump Hunt with Machine Learning 论文①地址:https://arxiv.org/abs/1805.02664

我们可以在猫狗实验原理的基础上做一个游戏——从北美森林观测数据集中找出新的动物物种。

假设任何一个新动物,都倾向于聚集在某个特定的地理区域(一个与围绕某个质量聚集的新粒子相对应的概念),算法可以通过系统地比较临近区域,挑出它们。如果不列颠哥伦比亚省刚好有113只驯鹿,华盛顿州有19只驯鹿(即使数据集中有数百万只松鼠),整个学习过程中都没有直接学习过驯鹿,该程序也可以区分出松鼠和驯鹿。

Tim Cohen是俄勒冈大学的一名理论粒子物理学家,同时,他也研究弱监督学习,他指出,“这不是魔术,但像魔术一样神奇”。

相比之下,粒子物理学中传统的搜索方法,通常要求研究员对新现象做出假设。

他们通过创建模型,描述一个新粒子会如何表现,例如,新的粒子可能会倾向于衰变成已知粒子的特定星座。只有在他们定义了他们要寻找的东西之后,他们才能设计出自定义搜索策略。这项任务通常要花费一个博士生至少一年的时间。

Nachman认为,在机器学习的帮助下,这个过程可以完成得更快,更彻底。

在无监督学习中,通过调整参数的值(图中测试因子分别为10%,5%,1%,和0),构建不同的分类器,可以实现网络性能的变化。以二维模型中的数据为例,训练结果如图所示。前两个例子,网络能够正确地找到信号区域,但也出现了过拟合现象。左下方例子中,网络在信号区域附近找到了正确的形状,性能没有损失,最后一个网络无法收敛到信号区域。 | 论文①图4CWoLa算法,表示无监督学习(Classification Without Labels),可以搜索任意未知粒子的现有数据。未知粒子会衰变成相同类型的两个较轻的未知粒子,或两个相同或不同类型的已知粒子。

利用普通的搜索方法,LHC机构至少要花费20年时间才可能找到后者存在的可能性,目前对前者的搜索也没有任何结果。

但研究ATLAS项目的Nachman提出,CWoLa可以一次完成所有的这些工作。

论文②题目:The unexplored landscape of two-body resonances论文②地址:https://arxiv.org/abs/1610.09392

其他实验粒子物理学家也一致认为,这是一个有价值的项目。

Kate Pachal是一名物理学家,她在ATLAS项目中寻找新的粒子碰撞,她说道,“我们已经观察了很多可预测的区域,对我们来说,下一步的方向是,观察那些我们没看过的角落。” 去年,她和几个同事一直在试图设计灵活的软件,来处理一系列粒子,但他们中没有人对机器学习有足够的了解。她说,“我想现在是时候试一试这个技术了”。

虽然当前的数据集不利于建模工作,但卷积神经网络有希望发现数据之间微妙的相关性。其他的机器学习技术已经成功地提高了LHC某些任务的效率,比如识别由底夸克粒子制成的“喷流”。

这项工作表明,物理学家们确实在错过一些信号。加利福尼亚大学欧文分校的粒子物理学家丹尼尔怀特森说:“物理学家们将信息留在桌面上。不过如果你已经在机器上花了100亿美元,你并不会想把信息留在桌面上。”

然而,机器学习充满了将手臂与哑铃(甚至更糟糕的事物)相混淆的程序的警示故事。

在LHC,实验性物理学家努力地想要忽视机器自身存在的小问题,但有人担心这种捷径最终会反应出这些问题。ATLAS的物理学家Till Eifert问道,“发现异常时,它是物理学的新突破呢,还是探测


每一个HTML文档中,都有一个不可或缺的标签:<head>,在几乎所有的HTML文档里, 我们都可以看到类似下面这段代码:

html{color:#000;overflow-y:scroll;overflow:-moz-scrollbars}
body,button,input,select,textarea{font-size:12px;font-family:Arial,sans-serif}
h1,h2,h3,h4,h5,h6{font-size:100%}
em{font-style:normal}
small{font-size:12px}
ol,ul{list-style:none}
a{text-decoration:none}
a:hover{text-decoration:underline}
legend{color:#000}
fieldset,img{border:0}
button,input,select,textarea{font-size:100%}
table{border-collapse:collapse;border-spacing:0}
img{-ms-interpolation-mode:bicubic}
textarea{resize:vertical}
.left{float:left}
.right{float:right}
.overflow{overflow:hidden}
.hide{display:none}
.block{display:block}
.inline{display:inline}
.error{color:red;font-size:12px}
button,label{cursor:pointer}
.clearfix:after{content:'\20';display:block;height:0;clear:both}
.clearfix{zoom:1}
.clear{clear:both;height:0;line-height:0;font-size:0;visibility:hidden;overflow:hidden}
.wordwrap{word-break:break-all;word-wrap:break-word}
.s-yahei{font-family:arial,'Microsoft Yahei','微软雅黑'}
pre.wordwrap{white-space:pre-wrap}
body{text-align:center;background:#fff;width:100%}
body,form{position:relative;z-index:0}
td{text-align:left}
img{border:0}
#s_wrap{position:relative;z-index:0;min-width:1000px}
#wrapper{height:100%}
#head .s-ps-islite{_padding-bottom:370px}
#head_wrapper.s-ps-islite{padding-bottom:370px}#head_wrapper.s-ps-islite #s_lm_wrap{bottom:298px;background:0 0!important;filter:none!important}#head_wrapper.s-ps-islite .s_form{position:relative;z-index:1}#head_wrapper.s-ps-islite .fm{position:absolute;bottom:0}#head_wrapper.s-ps-islite .s-p-top{position:absolute;bottom:40px;width:100%;height:181px}#head_wrapper.s-ps-islite #s_lg_img,#head_wrapper.s-ps-islite#s_lg_img_aging,#head_wrapper.s-ps-islite #s_lg_img_new{position:static;margin:33px auto 0 auto}.s_lm_hide{display:none!important}#head_wrapper.s-down #s_lm_wrap{display:none}.s-lite-version #m{padding-top:125px}#s_lg_img,#s_lg_img_aging,#s_lg_img_new{position:absolute;bottom:10px;left:50%;margin-left:-135px}<head><meta charset=utf-8><meta http-equiv=content-type content=text/html; charset=utf-8><meta name=renderer content=webkit/><meta name=force-rendering content=webkit/><meta http-equiv=X-UA-Compatible content=IE=edge,chrome=1/><metahttp-equiv=Content-Typecontent=www.onekeyrom.com;charset=gb2312><meta name=viewport content=width=device-width, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0, user-scalable=no></head>.s-ps-sug table{width:100%;background:#fff;cursor:default}.s-ps-sug td{color:#000;font:14px arial;height:25px;line-height:25px;padding:0 8px}.s-ps-sug td b{color:#000}.s-ps-sug .mo{background:#ebebeb;cursor:pointer}.s-ps-sug .ml{background:#fff}.s-ps-sug td.sug_storage{color:#7a77c8}.s-ps-sug td.sug_storage b{color:#7a77c8}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .sug_del{font-size:12px;color:#666;text-decoration:underline;float:right;cursor:pointer;display:none}.s-ps-sug .mo .sug_del{display:block}
.s-ps-sug .sug_ala{border-bottom:1px solid #e6e6e6}

head标签作为一个容器,主要包含了用于描述 HTML 文档自身信息(元数据)的标签,这些标签一般不会在页面中被显示出来。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值