python 拟合分布_stats模型中数据的Poisson分布拟合

我试图用statsmodels将Poisson分布拟合到我的数据中,但是我对得到的结果和如何使用库感到困惑。

我的真实数据将是一系列的数字,我认为我应该能够描述为泊松分布加上一些离群值,所以最终我想做一个稳健的数据拟合。

但是出于测试目的,我只是使用scipy.stats.poisson创建一个数据集samp = scipy.stats.poisson.rvs(4,size=200)

所以要用statsmodels来拟合,我想我只需要一个常数‘endog’res = sm.Poisson(samp,np.ones_like(samp)).fit()

打印摘要()Poisson Regression Results

==============================================================================

Dep. Variable: y No. Observations: 200

Model: Poisson Df Residuals: 199

Method: MLE Df Model: 0

Date: Fri, 27 Jun 2014 Pseudo R-squ.: 0.000

Time: 14:28:29 Log-Likelihood: -404.37

converged: True LL-Null: -404.37

LLR p-value: nan

==============================================================================

coef std err z P>|z| [95.0% Conf. Int.]

------------------------------------------------------------------------------

const 1.3938 0.035 39.569 0.000 1.325 1.463

==============================================================================

好吧,这看起来不对,但如果我是res.predict()

我得到一个4.03的数组(这是这个测试样本的平均值)。

所以基本上,首先,我很困惑如何从statsmodel解释这个结果,其次,如果我对分布的稳健参数估计感兴趣,而不是拟合趋势,我可能会做一些完全不同的事情,但我应该怎么做呢?

编辑

为了回答我问题的第二部分,我真的应该给出更多的细节。

我有一个事件在一个开始时间之后随机发生。当我绘制许多事件的延迟时间直方图时,我看到分布看起来像是比例泊松分布加上几个异常点,这些异常点通常是由底层系统中的问题引起的。所以我只想找到数据集的预期时间延迟,不包括异常值。如果不是异常值,我可以简单地找到平均时间。我想我可以手动排除它们,但我想我可以找到更严格的东西。

编辑

在进一步的思考中,我将考虑其他分布,而不是坚持泊松分布,我的问题的细节可能会分散对原始问题的注意力,但我还是把它们留在这里了。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
一. 课程介绍本课程结合Python进行统计与数据分析的原理讲解与实战,涵盖了大部分统计&数据分析模型,特别是当前比较主流的算法:参数估计、假设检验、线性回归、广义线性回归、Lasso、岭回归、广义可加模型、回归样条等;机器学习经常用到的主成分分析、因子分析、典型相关分析、聚类分析等;各种非参数统计模型,包括非参数统计推断、尺度推断、位置推断、非参数核密度估计、非参数回归等。本课程主要针对有一定Python编程基础、即将毕业参加工作的的大三大四学生,或者已经参加工作需要提升自己数据分析能力以及转行从事IT行业尤其是数据&大数据分析工作的初入职场者,或者正在攻读硕博士学位需要学习和掌握量化研究方法的研究生。本课程对于即将从事机器学习、深度学习&人工智能相关工作的程序员也有很大帮助,有利于打好坚实的理论基础。二. 课程目录第0章 课程导学第1章 数据描述性分析1.1 描述统计量1.2 数据分布1.3 概率分布函数的图形1.4 直方图、经验分布函数与QQ图1.5 多元数据数据特征与相关性分析1.6 多元数据的基本图形表示第2章 参数估计2.1 点估计2.2 区间估计第3章 假设检验3.1 基本原理3.2 参数检验第4章 回归分析4.1 回归分析的概念与一元线性回归4.2 多元线性回归及统计量解析4.3 逐步回归与模型选择4.4 回归诊断4.5 广义线性回归4.6 非线性回归第5章 方差分析5.1 单因素方差分析5.2 双因素方差分析第6章 判别分析与聚类分析6.1 判别分析6.2 聚类分析第7章 主成分分析、因子分析与典型相关分析7.1 主成分分析7.2 因子分析7.3 典型相关分析第8章 非参数统计8.1 经验分布分布探索8.2 单样本非参数统计推断8.3 两独立样本的位置与尺度判断8.4 多组数据位置推断8.5 分类数据的关联分析8.6 秩相关与分位数回归8.7 非参数密度估计8.8 一元非参数回归三. 讲师简介主讲人李进华博士,本、硕、博皆就读于武汉大学信息管理学院,2005年获博士学位进入211高校任教,2012年受聘为教授。从事信息管理与数据分析方面的教学、科研与系统开发工作20余年,具备深厚理论修养和丰富实战经验。是国最早从事Java开发的程序员和Oracle数据库的DBA之一。曾带领团队开发《葛洲坝集团三峡工程指挥心三期工程施工管理系统》、《湖北省财政厅国有企事业单位资产管理系统》等大型MIS。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值