这篇文章主要是为我们最近的工作 https://arxiv.org/abs/1903.09833 做宣传。考虑到盆友们大多不太熟悉我们领域(相对论性重离子碰撞、夸克-胶子等离子体),我希望用尽可能简单的语言把这个领域关心的问题说清楚,并且在叙述的时候会偏向于用机器学习的术语,毕竟我相信不少朋友是看到“机器学习”才关注这个专栏的哈哈哈~ 私心的说,我希望更多懂机器学习的盆友也能关注到这个领域,而不仅仅觉得 物理×机器学习 只有凝聚态里面才有 : (
好了,废话不多说,我们开始了~
我们的世界诞生于138亿年前的宇宙大爆炸,质子和中子一直在
我们关注的对象就是这个夸克汤, 既然它如同汤一样了,那么现在的问题是如何研究一碗汤?你可能会提出下面的这些问题:
- 当你对汤加热的时候,汤翻滚当地多么厉害? 【夸克汤的涨落】
- 当你用勺子去搅动汤,汤有多粘稠?【夸克汤的粘性系数】
- 当你觉得汤太烫用嘴去散热时,“汤分子”是怎么蒸发成气体的?【夸克汤经历相变成质子、中子】
- 当你没拿住碗,不小心把汤泼出去的时候,它是怎么运动的?【夸克汤的状态方程、运动方程】
- ……
看!很自然的,你会提出这些问题。一个变态的汤羹爱好者也许会把上面的问题连起来,形成这样一个实验:
- 首先他乘坐飞船跑到太空中,这样他就可以免受重力的干扰了;【能量尺度很大,引力可忽略】
- 其次他用一个密封的可伸缩的球型碗装满了肉汤,并压缩碗使得汤具有很高的密度和压强;【能量密度很高】
- 同时他还用酒精灯给汤加热,确保汤保持在沸点,温度高,以及有可观的热涨落(比如汤内部气泡的生成和破灭);【正是量子涨落和对称性自发破缺才导致我们宇宙的各向异性】
- 最后他突然撤掉碗的约束,让汤在真空环境下自由地向外膨胀;【夸克汤的运动方程】
- 有意思的是,液体状的汤在碰撞到飞船的内壁之前就已经蒸发成了“汤气体"。【夸克汤经过相变变成质子、中子等】
有的时候过于故事化的讲述不见得是件好事。你可能会开始怀疑上面神经兮兮的"飞船实验"到底是什么。正如飞船实验在研究极端情况下肉汤的运动一样,物理学家们通过相对论性重离子碰撞来产生夸克汤,从而来研究夸克汤的性质。飞船实验中苦心制造的高温、高密以及大涨落的实验环境,可以简单地(当然不简单)通过让两个高能重离子迎头对撞得到。值得一提的是两个重离子碰撞的部分会沉积下来变成夸克汤,而没有碰撞的"旁观者"就几乎沿着原方向飞走了。由于碰撞参数和核子位置的涨落,不同的碰撞事件沉积下来的夸克汤的能量分布是不同的。逐事件的涨落(event-by-event fluctuations),是相对论性重离子碰撞中一个重要的观察。
总结一下,实验上可以观测到的末态粒子分布,是由初态涨落和演化的动力学过程所共同决定的。我们领域的一个重要目标,就是从末态的实验数据中提取初态和动力学中重要的参数。这是一个很典型的反问题,反问题的解决思路有:
- 物理思想:利用人类的智慧,构造物理理论。用最简单基本的原理,解释既有的实验现象,又能够对新的实验现象给出正确的预言;
- 工程思维:人肉特征工程,寻找对待提取的参数敏感的特征,特征有直接的物理意义,是物理学家人为构造的;
- 暴力美学:通过机器学习提取特征,特征丰富但可能解释性不强。
传统的科学中,人们往往是通过1和2进行科学研究的。现在计算机的算力上来了,我们不妨试试科学的“第四范式”,通过数据驱动的方式来研究科学(尤其是复杂系统)。悲观的说,我不觉得这种范式可以彻底地改变科学,但这种范式可以帮助科学家们更好地和高维、海量数据打交道。传统上,科学家们会通过物理直觉定义一些观测量,把高维数据压缩低维数据,然后和低维数据打交道。第一,既然是压缩过程,那么必然只抓住了Big Picture, 会丢失一部分信息,这部分丢失的信息是重要的吗?第二,压缩过程中用到的数学操作(比如积分,非线性变换等等)对于当前的问题就是最优的吗?
有了机器学习,我们就可以尝试回答上面的两个问题了。机器学习的好处在于它的各种算法提供了种种可能,让我们能够窥见数据的各个侧面,从而更全面的了解手头的数据,往往可以发现数据中有趣的特征(传统方法所发现不了的)。从这个意义上来说,机器学习不是做科学,而是刺激科学,当然机器学习的重要性主要体现在工程的意义上,而不是科学本身。
下面我们抽象一下问题:不就是我有一个初态,中间有个演化,最后达到末态吗?演化可以看作一个映射,映射由
所以重要的是从理论上找到函数关系
或者类似KL散度的方式
这个过程我们假设参数化已经完成了,但实际上核心问题就是如果参数化?就是说
- 第一,区分度。不同事件之间的方差是否足够大。比如说你定义了一个标量
,这个标量对不同的初态输出相同的数值,显然它不是一个好的观测量;
- 第二,初态和末态的参数具有简单的关系。如果初末态的观测量一一对应,具有对角的结构,这是坠吼的;
- 第三,参数的可解释性。它对应什么样的物理模式;
- 第四,实验可以观测。需要多小的统计误差才能在实验上很确信地证明/证伪这种模式。
吼吼~刚刚讨论了些很抽象的东西,具体到这篇文章(https://arxiv.org/abs/1903.09833)上来看,我们干了些什么呢?
传统上,对于初态,人们采用了很直观的分解方式。在二维平面的极角方向
经过夸克汤的演化过程,人们希望系统保持“形状不变性”(我自己杜撰的名词),也就是说椭圆的初始状态会演化成椭圆形的末态,三角形的初始状态会演化成三角形的末态,等等……但是自然界还是太复杂啦,人们发现了很多非线性耦合的形式: 两个椭圆可以耦合成一个四边形,一个椭圆一个三角形可以耦合成一个五角星……等等。这造成的一个困难是,当我获得一个末态事件的四边形的系数的时候,它一部分来自于初态的四边形,另一部分来自于初态的椭圆和自己的耦合,我们很难知道每一部分分别占多少贡献。
还有一个问题是,这种傅里叶分解的方式可能不是最“经济”的,而且很可能不具有最优的“区分度”,因为傅里叶分解并没有明显地干这件事情。相反,主成分分析(PCA)方法具有这样两点好处:从原理上,它就保证了最小化残差,和最大化方差。文章中我们用PCA的方法对末态数据进行了分解。
分解的结果非常有趣,我们发现PCA的基向量大致上和傅里叶的基是一样的,但还是有略微的不同。在奇异值上,我们发现了“配对”的现象,这其实是由于
我们现在可以长舒一口气了,人类靠直觉定义的参数和机器用某种最优化准则定义出来的参数是类似的。人类没有错太远。然而比较遗憾的也正是因为这一点,这个工作不会是一个颠覆性的工作,而最多是原有方法的修补。
但是修补也挺重要的嘛~前面说到了,我们希望初态参数(
PCA可以减低同一组变量之间的关联,这个从数学上就会有保证。但是对一组变量做PCA, 让另一组变量保持不变,我们竟然发现两组变量之间的关联变得更加对角,这远非一件显然的事情……这个现象更像是一个赠品,因为PCA的数学上并没有保证这一点。如果是想更明显地做这件事,可以使用关联成分分析(CCA), 不过我试了后发现人类还是没有错太远。
这篇文章的结果,是偶然间发现的。当时是想通过炼丹一口气解决从末态到初态的直接映射,PCA只是作为一个预处理技巧,没想到里面还有这么多有趣的事情。
题外话:一个更有趣的事情。对于夸克汤的研究,人们是从大图像到越来越丰富和细致的刻画。一开始是平均流(认为没有逐事件的涨落),再是一阶流(偶极),再是二阶流(椭圆),紧跟着是三阶流(三角)、四阶流(四方)、五阶流(五角)、六阶流(六角)……这样一个认识的过程。我们假设这样一个认知过程完全来自于实验技术的提升(越小的信号需要越精确的测量),我们会发现根据PCA的结果,人们会依次发现平均流
一个充满野心的问题是:有没有可能找到一个分解方式,这种分解方式可以对模式进行重要性排序,同时兼顾不同模式在概念上的复杂性,给出的排序恰好和人类探索夸克汤过程中提出的观测量的时间顺序刚好符合?甚至对于未来新的观测量的提出给出指导意义?(观测量不仅仅有n阶流,还有它们之间的各种非线性耦合……)
好像扯太多了……我觉得是很难的。也许平行世界的物理不是这样发展的呢,呵呵。
最后还是要感谢宋慧超老师和赵文斌师兄,很多想法都是他们给的,以及教我如何写科学论文(虽然我好像还是没有完全学会呜呜呜)。
还要补充说一句,机器学习入侵我们领域还不是很多,目前本领域称得上ML+X的文章用两只手可以数得过来,希望下次有时间的话可以写写。我们组有个目标就是“毒害”本领域的其它学者。机器学习某种意义上就是唯象学,所以机器学习“入侵”高能唯象领域只是迟早的事情。我不敢说机器学习能够给高能物理带来什么腥风血雨,但至少作为一种新的思路、新的工具,它必然会给高能物理这个领域带来新的生机。