python做线性回归统计推断提取参数_python – 从pymc3中的推断参数预测

本文介绍了如何在pymc3中进行线性回归的统计推断,特别是如何利用后验预测分布进行预测。通过从模型参数的后验分布中取样,并对样本进行平均,可以考虑参数不确定性,从而提供更全面的预测结果。这种方法对比了传统的机器学习库如scikit-learn的预测方法,并提供了在实际应用中将后验抽样结果整合到预测中的建议。
摘要由CSDN通过智能技术生成

我试图从非贝叶斯背景中理解这一点.

在线性回归或黑盒机器学习工具中,工作流程类似于以下内容.

>获取数据

>准备数据

>模型数据(从中学习[或部分,训练集])

>测试模型(通常在测试集上)

>如果模型根据某个指标是好的,请转到6,否则

调查和修改工作.

>模型足够好;用它来预测/分类等

因此,假设我使用pymc3来了解广告支出与销售商品收入之间的关系.如果从1到5的所有阶段都顺利,那么在R和机器学习包中使用的频繁统计数据(例如scikit-learn)中,我只需要将新的看不见的数据传递给学习模型并调用预测方法.这通常会打印出Y的预测值(来自销售商品的收入),给定X(广告支出)的一些看不见的值,仍然会考虑一些置信区间或一些其他误差幅度.

如何在pymc3中做到这一点?如果我最终得到许多斜坡和许多贝塔,那么我应该用它来预测?并且不会采用所有斜坡和所有贝塔的平均值来抛弃许多其他有用的学习知识?

我发现如果难以理解后验的采样如何有助于此.人们可以想象老板需要被告知销售商品的预期收入Y数字给出一些广告支出X金额,有一些信心和误差幅度.除了绘图之外,我不知道如何将后验抽样纳入管理报告中,并使其对有关各方的现金流量计划有用.

我知道我们中的一些人来自R并且可能是scikit-learn,但如果有一种预测方法以更统一和标准化的方式处理这个问题,那会不会很好?

谢谢

解决方法:

在使用模型进行预测时考虑参数不确定性的一种方法是使用posterior predictive distribution.此分布告诉您新观察的概率,以您用于约束模型参数的数据为条件.如果收入是Y,广告支出是X,模型参数是theta,用于约束模型的数据是X’,那么你可以写

左侧是在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值