概率与统计
数据分析中的统计学基本知识
小笼包xiaolongbao
想从事数据分析,甚至梦想数据挖掘的浙大理科生
展开
-
数据预处理
标准化、归一化 or 中心化?注意:需要去除离群值时,当数据本身比较聚集,也就是离散程度不高,使用3σ\sigmaσ会比箱型图要好,因为这个时候的箱型图可能找不出离散值,都在1.5IQR以内。为什么要线性变化线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化/标准化的前提。比如有一个很重要的性质:线性变换不会改变原始数据的数值排序,那...原创 2020-02-13 17:06:13 · 263 阅读 · 0 评论 -
点估计中二阶中心距与总体样本方差的区别
https://blog.csdn.net/qq_41228218/article/details/94584393https://blog.csdn.net/huguozhiengr/article/details/81607637转载 2020-02-12 22:24:40 · 1776 阅读 · 0 评论