《Machine Learning for Algorithmic Trading》Bayesian ML-CSDN博客

本文链接：https://blog.csdn.net/SharonSheeran/article/details/118698109

本章介绍了贝叶斯机器学习在交易策略中的应用，探讨了贝叶斯统计如何量化未来事件不确定性，并在金融市场中动态适应。内容包括贝叶斯方法在机器学习中的应用、概率编程、模型训练、动态夏普比率计算和配对交易对冲比率的估计。此外，还详细阐述了贝叶斯定理、动态更新信念以及如何根据新证据调整假设。最后，通过案例展示了如何使用PyMC3进行贝叶斯夏普比率的比较，以评估不同投资策略的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

贝叶斯机器学习 – 动态夏普比率和配对交易

在本章中，我们将介绍机器学习 (ML) 的贝叶斯方法以及它们在开发和评估交易策略时，对不确定性的看法会增加这一看法原本价值的不同之处。

贝叶斯统计使我们能够量化未来事件的不确定性，并在一个新信息出现时用一个原则性方式定义我们的预测。这种动态方法很好地适应了不断发展的金融市场。当相关数据较少并且我们需要系统地整合先验知识或假设时，它特别有用。

我们将看到机器学习的贝叶斯方法可以围绕统计指标、参数估计和预测更丰富地洞察不确定性。应用范围从更多精细风险管理，以动态更新包含市场变化的预测模型环境。 Black-Litterman 资产配置方法（参见第 5 章，投资组合优化和性能评估）可以解释为贝叶斯模型。它计算资产的预期回报作为市场均衡和投资者观点的平均值，通过每项资产的波动性、跨资产相关性以及每个预测的置信度。

更具体地说，在本章中，我们将介绍：

贝叶斯统计如何应用于机器学习
使用 PyMC3 进行概率编程
使用 PyMC3 定义和训练 ML模型
如何运行最先进的采样方法来进行近似推理
用于计算动态夏普比率、动态配对交易对冲比率的贝叶斯 ML 应用程序，并估计随机波动率

贝叶斯机器学习的工作原理

据说古典统计遵循频率论方法，因为它将概率解释为从长远来看，即在观察大量试验之后，事件的相对频率。在概率的上下文中，事件是实验的一个或多个基本结果的组合，例如掷两个骰子的六个相等结果中的任何一个或资产价格下跌 10%。

相比之下，贝叶斯统计将概率视为对事件发生信心的测量方法。因此，贝叶斯视角为主观观点和意见分歧大于频率解释。这种差异对于以下事件最为显著：发生的频率不足以达到长期频率的客观衡量标准。

换句话说，频率统计假设数据是来自总体的随机样本，旨在确定生成数据的固定参数。反过来，贝叶斯统计将数据视为给定的，并将参数视为具有可从数据推断出的分布的随机变量。作为结果，频率论方法至少需要与要处理的参数一样多的数据点估计的。另一方面，贝叶斯方法与较小的数据集兼容，并且非常适合一次从一个样本进行在线学习。

贝叶斯视图对于许多罕见或独特的现实世界事件非常有用。比如下一次选举的结果或市场是否会3个月内崩溃。在每种情况下，随着事件的临近都有相关的历史数据和独特的情况出现。

首先我们将介绍贝叶斯定理，通过将先前的假设与新的经验证据相结合，将更新信念的概念具体化，并将由此产生的参数估计与他们的频率结合。然后我们将展示贝叶斯统计推断的两种方法，即共轭先验和近似推理，可以深入了解后验分布潜在的（即未观察到的）参数，例如期望值：

共轭先验通过提供封闭形式的解决方案来促进更新过程，使我们能够精确计算解。然而，这种精确的分析方法并不总是可用的。
近似推理模拟由组合假设和数据产生的分布并使用来自该分布的样本来计算统计见解。

拓展

最常见应用场景

文本分类/垃圾文本过滤/情感判别：这大概会朴素贝叶斯应用做多的地方了，即使在现在这种分类器层出不穷的年代，在文本分类场景中，朴素贝叶斯依旧坚挺地占据着一席之地。因为多分类很简单，同时在文本数据中，分布独立这个假设基本是成立的。而垃圾文本过滤(比如垃圾邮件识别)和情感分析(微博上的褒贬情绪)用朴素贝叶斯也通常能取得很好的效果。

多分类实时预测：这个是不是不能叫做场景？对于文本相关的多分类实时预测，它因为上面提到的优点，被广泛应用，简单又高效。

推荐系统：是的，你没听错，是用在推荐系统里！！朴素贝叶斯和协同过滤(Collaborative Filtering)是一对好搭档，协同过滤是强相关性，但是泛化能力略弱，朴素贝叶斯和协同过滤一起，能增强推荐的覆盖度和效果。

————————————————

原文链接：https://blog.csdn.net/liuzheng081/article/details/81166720

如何根据经验证据更新假设

“当事实改变时，我会改变主意。你要做什么，先生？”

——约翰·梅纳德·凯恩斯

托马斯·贝叶斯牧师在 250 多年前提出的定理，使用基本的概率论来规定概率或信念应该如何作为相关的新信息而改变到达。前面的凯恩斯引文抓住了这种精神。它依赖于条件和总概率和链式法则；参见 Bishop (2006) 和 Gelman 等人。 (2013) 介绍和更多。概率信念涉及单个参数或参数向量（也：假设）。每个参数可以是离散的或连续的。可能是一维统计数据，如（离散）模式分类变量或（连续）均值，或更高维的值集，如协方差矩阵或深度神经网络的权重。