![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python与统计学
文章平均质量分 96
-派神-
每天进步一点点……
展开
-
使用PyOD来进行异常值检测
异常值检测主要是为了发现数据集中的一些"与众不同"的数据值,所谓“与众不同”的数据值是指这些数据与大多数数据存在较大的差异我们称之为“异常值”,并且在现实中这些“异常值”并没有被打上标签,因此我们必须通过某种算法来自动识别出这些异常值。对于异常值我们有如下的定义:异常值所占整体数据的比例较少,产生异常值的概率非常低。 异常值本身的特征与其他正常值有明显的差异。数据在本篇博客中我们的数据来自于国外某连锁零售企业的客流量与订单数量统计数据,为了让数据更加清晰,我们只保留了如下3个字段:date:原创 2021-07-25 12:47:33 · 4314 阅读 · 3 评论 -
python与统计学:正太分布(一)
当我们拟合了一个线性回归模型以后,我们需要检验归回模型预测的准确度,这时候我们可能需要计算预测值和实际值之间的残差,理论上残差应服从正太(高斯)分布,那么如何来检验数据是否服从正太分布呢?我们可以通过画QQ图的方式来直观的检验数据是否服从正太分布: 我之前写的一篇有关方房价预测的博客中简单说明了如何来画QQ图,今天我打...原创 2019-04-27 23:07:49 · 4197 阅读 · 1 评论 -
使用Python、PyMC3、ArviZ的贝叶斯统计实战开发
统计学中有两个主要学派:频率学派和贝叶斯学派,他们之间有共同点,又有不同点。为了说清楚他们之间的差异,我们从统计推断所使用的三种信息说起。总体信息即总体分布或者总体所属分布族给我们的信息,譬如,总体是“正太分布”,那我们就知道它的密度曲线是一条钟形曲线,并且有μ和σ这两个参数,它们分别正太分布的均值和标准差(方差)。总体信息是很重要的信息,为了获取此种信息往往耗资巨大。如美国军方为了获得某种...原创 2019-08-18 12:03:24 · 7642 阅读 · 12 评论