贝叶斯数据分析_贝叶斯数据分析(二)

82780340ba9ff9aaf54c347f4bc9ee50.png

        这次我们接着上次的实例继续讨论,在实例中,我们通过与真实数据之间的对比来筛选随机参数,最后得到一个后验的概率分布,虽然从图中很难看出,但拥有最高概率的签约率是38%。这个38% 就是对于签约率这个参数的最大似然估计,最大似然估计的意思是38%签约率能够使你观察到真实数据的概率最大化。同时,我们也可以用置信区间来估计签约率,即签约率在30-45%的概率是90%。总结来说,这种利用模拟数据进行贝叶斯数据分析的方法叫做近似贝叶斯计算,概念上很好理解但是运算速度慢,另外还有其他更快的方法可以使用,但是他们的结果都是相同的。

        贝叶斯数据分析并不是一类模型,而是一种分析框架,一种思维方式,统计学模型都可以在这个框架中使用,例如不同的机器学习模型就可以和贝叶斯框架结合,有贝叶斯回归模型,贝叶斯决定树模型,贝叶斯神经网络等等。

为什么使用贝叶斯框架分析数据?

        用贝叶斯框架分析数据时,我们有更大的操作空间,除了真实数据以外,我们还可以加入不同的信息,比如一些专家观点,将这些信息与先验概率分布融合。在(一)的实例中我们使用的是均匀概率分布,又名非信息分布(non-informative distribution)。如果我们加入事先知道的信息,那么这个概率分布将会改变,变为信息分布(informative distribution)。当数据量比较少的时候,先验的概率分布会对后验概率分布产生非常大的影响,后验的概率分布将会和先验非常相似,我们可以想象在没有任何数据的情况下,后验和先验的概率分布将会完全相同。但是随着数据不断增加,先验的影响将不断减弱,当数据量非常大的时候,先验的概率分布将不会产生任何影响。

        另外,贝叶斯分析的结果保留了估计参数的不确定性,这在预测和决策分析中非常有用。决策分析是一种在金融/商业领域使用的策略分析,主要关注的并不是参数值结果的多少,而是结果的不确定性、未来收益变动的范围和如何避免不同类型的损失,因为对于金融/商业而言,结果的不确定性意味着风险,而风险管理比收益的大小更加重要。

为什么使用贝叶斯数据分析?

  1. 如果原来的数据分析框架运用时没有出现问题,那么没有必要特地换成贝叶斯数据分析。

  2. 如果并不想了解结果的不确定性,也没必要使用贝叶斯框架。

  3. 无法满足计算能力的高需求。

        我们可以发现贝叶斯数据分析对于计算能力的要求非常高,我个人的经验是就算是中等以上性能的电脑,运用蒙特卡洛模拟来进行贝叶斯数据分析,在模拟上万次的情况下,起码需要需要10至20分钟的时间,而且这个时间会随着模拟次数和模型的复杂程度的增加而不断增加,因此未来计算机性能的高速发展是推广贝叶斯数据分析的重要基础。

        完结。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值