python 拟合分布_stats模型中数据的Poisson分布拟合

最新推荐文章于 2024-03-03 01:00:00 发布

weixin_39604092

最新推荐文章于 2024-03-03 01:00:00 发布

阅读量1k

点赞数

文章标签： python 拟合分布

我试图用statsmodels将Poisson分布拟合到我的数据中，但是我对得到的结果和如何使用库感到困惑。

我的真实数据将是一系列的数字，我认为我应该能够描述为泊松分布加上一些离群值，所以最终我想做一个稳健的数据拟合。

但是出于测试目的，我只是使用scipy.stats.poisson创建一个数据集samp = scipy.stats.poisson.rvs(4,size=200)

所以要用statsmodels来拟合，我想我只需要一个常数‘endog’res = sm.Poisson(samp,np.ones_like(samp)).fit()

打印摘要()Poisson Regression Results

==============================================================================

Dep. Variable: y No. Observations: 200

Model: Poisson Df Residuals: 199

Method: MLE Df Model: 0

Date: Fri, 27 Jun 2014 Pseudo R-squ.: 0.000

Time: 14:28:29 Log-Likelihood: -404.37

converged: True LL-Null: -404.37

LLR p-value: nan

==============================================================================

coef std err z P>|z| [95.0% Conf. Int.]

------------------------------------------------------------------------------

const 1.3938 0.035 39.569 0.000 1.325 1.463

==============================================================================

好吧，这看起来不对，但如果我是res.predict()

我得到一个4.03的数组(这是这个测试样本的平均值)。

所以基本上，首先，我很困惑如何从statsmodel解释这个结果，其次，如果我对分布的稳健参数估计感兴趣，而不是拟合趋势，我可能会做一些完全不同的事情，但我应该怎么做呢？

编辑

为了回答我问题的第二部分，我真的应该给出更多的细节。

我有一个事件在一个开始时间之后随机发生。当我绘制许多事件的延迟时间直方图时，我看到分布看起来像是比例泊松分布加上几个异常点，这些异常点通常是由底层系统中的问题引起的。所以我只想找到数据集的预期时间延迟，不包括异常值。如果不是异常值，我可以简单地找到平均时间。我想我可以手动排除它们，但我想我可以找到更严格的东西。

编辑

在进一步的思考中，我将考虑其他分布，而不是坚持泊松分布，我的问题的细节可能会分散对原始问题的注意力，但我还是把它们留在这里了。

weixin_39604092

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 拟合分布_stats模型中数据的Poisson分布拟合

我试图用statsmodels将Poisson分布拟合到我的数据中，但是我对得到的结果和如何使用库感到困惑。我的真实数据将是一系列的数字，我认为我应该能够描述为泊松分布加上一些离群值，所以最终我想做一个稳健的数据拟合。但是出于测试目的，我只是使用scipy.stats.poisson创建一个数据集samp = scipy.stats.poisson.rvs(4,size=200)所以要用stats...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。