![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计
Einsam0
这个作者很懒,什么都没留下…
展开
-
python 核函数累积概率函数
画直方图的时候,可以叠加个核密度函数,图也很好看,如果对当面这一列数据,画图之后,想知道累积概率那如何获得呢,也就是cdf,pdf倒是容易获得,很多函数直接就有,因为用的多,网上一搜也都能搜到。但是获取累积概率函数,就少很多了。找不到。scipy的包中,也有一个函数说可以求cdf,但是没有说用法,我太笨了,还是不会,后来在stackoverflow找到了一种用法。先画出来pdf的图,也就是概率密度曲线,也就是核密度曲线。这个x是自动生成的等差数列,直方图的区间。ag = stats.gauss原创 2021-07-01 17:17:44 · 1256 阅读 · 0 评论 -
RSME,MSE,R2等指标的解释与思考
最近做一个算法,直接算法中就计算了一个叫做RMSE的值,开始出来我以为是准确率,类似于,clf.score,后来想想好像不对,所以就看来一些文章来研究了一下这些的含义。预测值和真值相差的平方和是SSE,也就是误差平方和,这肯定是越小越好了,相当于一个误差累计。当然这个SSE越接近于0越好。但是,如果说10000的样本的情况,建立一个A模型,这个模型的SSE是100,100个样本的情况...原创 2018-08-15 15:09:37 · 26820 阅读 · 1 评论 -
缺失值处理总结
在测点测数据的时候存在异常值的情况,比如测得值在量程之外,该值没有意义无法使用,归类在异常值中,作异常值处理,将该异常值删除,则问题转化为缺失值处理。缺失值处理的方法有两种,一种是不处理,直接删除,一种是用合适的值去填补。针对我们的业务需求,我们采用填补的方法,缺失值的填补有很多种方法,分享几种主流的适合业务的方法。1)特殊值填补将所有异常值都作为空缺值填补,用一个固定的值去填补,例如用9...原创 2019-04-16 15:49:32 · 1265 阅读 · 0 评论