描述统计学
当拿到一份数据时,首先应该怎么做?
数值数据可以计算,分类数据表示分类,例如男女等。二者可以相互转换,例如年龄的数值数据可以转换为中年、青年等分类数据。
分类数据描述统计
频次统计:单纯对各分类计数就可
频数百分比:单纯对各分类计数就可
数值数据描述统计
统计度量和图形
统计度量:
- 平均数
- 中位数 :平均数大于中位数时,说明数据不均衡,较大的数据较多。
- 众数
- 分位数
可以结合二八法则,计算前20%的数据,rank,然后取count的0.2。 - 方差 :均值和中位数相同时,看方差,方差越大,波动性越强
- 标准差:描述数据的离散程度
- 数据标准化
- 权重预估
标准化之后做一个简单地累加或者均值 - 切比雪夫定理
可用来异常值检测。
图形:
描述分类数据的,但是可以将数值数据转换为数值数据。直方图可以在箱体图的基础上划分更多的分位值。
偏度
标准型分布
搜索加载项,加入“分析工具”,本身,分析工具是在数据栏里。
概率
抛硬币:事件{正面,反面},概率:50%
贝叶斯定理:
从结果推某个原因的可能性有多大,不仅要知道结果,还要分析原因,针对原因分析事件合理性或者找解决方案。
参考链接:【秦路】七周成为数据分析师《第六周:统计学》