就像抛硬币：概率如何误导我们认识宇宙？

最新推荐文章于 2024-07-26 13:24:37 发布

「已注销」

最新推荐文章于 2024-07-26 13:24:37 发布

阅读量427

点赞数

文章标签：人工智能机器学习计算机视觉数据分析 ai

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/108839628

版权

全文共4280字，预计学习时长11分钟

图源：unsplash

想要了解宇宙，理论物理学或许是进行预测时最强大的工具。一方面，运用理论物理学可以在宇宙层面上了解宇宙的运作，知晓宇宙构成和运行所遵循的规律；还可以回归规律本身，加入一些初始条件，将时钟拨回任何想要的时间，并模拟我们将生成什么样的宇宙。

图片显示了宇宙微波辐射背景下，两个半球的热点和冷点。这张图片蕴含了大量关于早期宇宙的信息。在期望中，两个半球具有相同的平均温度和其他类似的属性，但是自然现象或是偶发事件可能会造成期望与现实的差异。

当然，可以根据需要进行多次模拟，并确定生成一个具有特定内部结构和现象的宇宙的概率是多少。但是在测量时，只有一个宇宙可供观测。大多数情况下，观测结果与模拟预测十分吻合。

但有时候，极小概率事件也会发生。那些批判现代宇宙学的人往往会以这些小概率事件为例，来证明现代宇宙学家从根本上就是错误的。概率能且经常会引导人们误解宇宙，以下是一些例子：

宇宙中的大规模观测，无论是宇宙微波背景、星系团或是单独的星系，都需要用暗物质来解释观测的结果。大规模的结构离不开暗物质，这些结构的起源，宇宙微波背景也离不开暗物质。这些波动本质上应该是随机且具有高斯性的。

举一个纯数学的简单例子：抛硬币。假设硬币质地十分均匀，抛出的结果只有两种，正面和反面，每面出现的概率为50%。为模拟每一种可能，在脑海中尽可能多地抛出硬币——假设抛了10亿次——记录下每种会出现的可能。

你可以选择如何划分这10亿次试验：连续10亿次为一组、1000次为一组试验，做100万次或者10次为一组，做1亿次实验。

当然，因为这是一个非常简单直白的数学问题，所以可以准确计算出概率。然而，一般情况下，大多数模拟的物理过程都太过复杂，以至于要经常要通过做出更为精准或更全面的模拟才能减少错误。

一切准备就绪，接下来就要真的抛硬币了，并且将真正试验的结果与模拟结果相对比，得到的结果可能很非比寻常。

掷硬币出现正面朝上或反面朝上的次数是50/50。如果结果不是50/50，也并不意味着硬币不出现了问题。而且在统计上，正面或反面朝上的次数多于预期是有极有可能的，而仅仅几次的抛掷也不能证明硬币有问题。

如果选择一次抛出10枚硬币呢，结果会是如何？大多数人本能地会认为结果是5正5反。确实，这是抛10枚硬币最常见的结果，但是出现该结果的概率并不是非常大。实际上，5正5反的几率只有24.6％，大约1/4。

假如抛10枚硬币并连续10次获得了相同的结果，你会认为结果是受到操纵了吗？没谁会为了这样不合常理的结果而困扰，十次全部为正面或反面的几率也非常低，仅为0.2％：1/512。

那么如果一次抛出10枚硬币，结果有5枚是正面，是否会有点惊讶呢？这应该惊讶吗？事实证明，每次掷出10个硬币时，连续出现5个正面的机会为10.9％：概率大约为1/11。

随机抛出10枚抛硬币共有1024种可能的结果，并且每种可能出现的概率均等。尽管出现“正正反反反正正正正正”（HHTTTHHHHH）的概率与其他结果出现的概率相同，但该结果中连续出现5个正面的概率却很低。不能通过这一次试验就确定硬币质地是否均匀。

期望不同，对试验结果的怀疑程度也会不同，可能增加（或者减少）。如果连续抛1枚硬币10次，并且结果是5正5反，你可能会说：“这和设想完全一致。”然后忘却此事。

如果连续5次都抛出了正面，你可能会想：“这有点出乎意料，但是也不值一提。”并将此事抛诸脑后然后继续试验。

然而如果结果是10正或10反，你或许就会有点担心了。因为所有都是正面或反面的概率太低了，可能疑惑：“有些不对劲。或许在假设里这是一个均质硬币，正面或反面的概率为50/50，它实际质地不均匀？”也许是，也许不是。但毫无疑问，解答这个问题最好的方式就是做更好的试验，而这需要进一步的调查。

如果一次抛20枚硬币，偶尔也会连续5次甚至6次正面朝上。但这并不意味着这个结果与先前的结果无关，或者硬币是否均质。

例如，比起仅抛出10枚硬币，如果一次抛出100枚或者1000枚硬币，得到的结果将更容易判断。即使前10次的结果都是正面朝上，在硬币确实是均质的情况下，甚至还会期望之后出现更多次正面。

连续出现100次正或100次反的几率微乎其微：大概是1：10³⁰；如果这种情况发生，则清楚地表明存在问题。但是，出现至少60个正面或60个反面的几率并不是很低：大约5.7％。

这种情况就属于“不值一提”的那一类了。但是有时候，即使最终结果不与预期相悖，进一步的调查也至关重要。10次中至少有6次正面朝上的概率是38%：没什么大不了。但是100次中至少60次正面的概率仅为2.8%，而1000次中至少600次正面朝上概率就小于十亿分之一了。

通常，更大的样本容量也会带来更多的数据，有助于区分试验中哪些是随机波动而哪些意味着模型存在漏洞。

模拟结果（红色）和星系调查（蓝色/紫色）显示的大规模聚类模式彼此相同，即使是在数学细节方面也是如此。如果不存在暗物质，那么这些结构不仅会在细节上有所不同，而且甚至不存在。星系将十分罕见，并且其中几乎只包含轻元素。

抛硬币背后的简单数学模型一样可以应用于科学领域：无论是生物学，粒子物理学还是宇宙学。因为已经了解宇宙如何运行——它遵循的规律、组成成分以及产生的初始条件——所以可以模拟宇宙的内在结构是如何随时间形成、演化和增长的。

基于相同的规律和组成内容，随机选择初始条件并反复模拟宇宙进而观察结果。观察这些模拟生成的宇宙并提出以下问题：

· 模拟的宇宙在何时开始形成恒星？

· 第一个星系团何时出现，它有多大？

· 模拟宇宙中何时出现两个以一定速度碰撞的星系团？

· 模拟宇宙时，一边比另一边热的情况出现的频率是多少？

毕竟，如果想要想将模拟生成的宇宙与所期望的模型进行比较，就需要先知道实际得到结果的可能性（或不可能性）是多大。

图片是宇宙历史示意图，重点要关注宇宙的电离。在恒星或星系形成之前，宇宙充满了挡光的中性原子。虽然大部分宇宙直到5.5亿年后才被电离，但一些部分有幸在早前就已经被电离了。

事实上，大多数模拟实验得到的结果往往与预期一致。在模拟宇宙早期结构产生时发现，第一颗恒星形成于大爆炸之后约5千万-1亿年，第一批恒星形成于大爆炸之后约2亿年，并且足以在3-4亿年后使宇宙再电离。在目前的技术极限下，所观测到的遥远星系和类星体都表明这张图片是正确的。

但是，在将发现的星系团和期望的星系团进行对比时，结果并不是那么清晰。例如“El Gordo”星系团，它是一个超大质量的年轻星系团，能造成极强的引力透镜效应，并且其由于相对近期发生的融合或碰撞而释放X射线。

在典型的模拟中，宇宙中应该只有少数几个像“El Gordo”的星团，并且由于探索的宇宙数量有限，几乎不太可能找到一个这样的超大星团。

“ElGordo”星系团是宇宙中最大的星系团之一，并且有可能是已知的宇宙历史上早期最大的星系团。根据假设的结构形成模型，在宇宙的早期，不太可能发现如此巨大的物体，但只有一个宇宙可供验证这一结论。

但有些事发生的概率可能更低。子弹星系团（其中有两个星系团正发生高速碰撞）清晰地证明了普通物质（释放X射线）和总物质（其质量引起引力透镜效应）之间的分离。这也是暗物质存在的最清晰证据。

但是，当按照所了解的暗物质模拟宇宙时，得到一对高速碰撞的星系团的几率很小：概率一般低于千分之一，而在一些模拟中低至十亿分之一。而且，宇宙大爆炸（宇宙微波背景）遗留下的热辐射在最大范围内表现出的温度波动要比理论上预测的要小得多。在模拟宇宙时，模拟产生的温度波动与观察到的一致的概率为1/770。

如果对当前的宇宙学模型不满，你或许会指出以上问题中的一个，然后宣布：“看到了吗？当前的模型完全是错误的！”但这是一条危险的道路，因为它证明了概率如何导致自欺欺人。

大爆炸遗留下的热辐射波动、宇宙微波背景，按照预测应该遵循一定幅度分布，分布与规模相关。前两个多极矩在幅度上低于预测值很多，但人们对于这一现象的解释各执一词。

观察模拟的宇宙时，会仔细检查它是否与预期有偏差。而预期基于当前对宇宙运行的理解：已知的规律是什么，已知的组成和初始条件是什么。如果结果偏离预期，必须考虑以下可能：

· 规律是错误的。

· 组成成分错误。

· 并且/或者初始条件错误。

但是，即使假设没有错误，也存在完全不同的可能性。尽管得到的结果匪夷所思，但这可能就是我们模拟得到的宇宙。如果查看模拟的宇宙并以一百万种不同的方式对其进行异常测试，就会发现其中45500次的显著性为2σ，2700次显著性为3σ，63次显著性为4σ，甚至还会有1次显著性达到5σ，而在物理学中，5σ通常被认为是“黄金标准”。

这种情况只会偶然发生，而这就是我们模拟得到的宇宙的反映。