(秦路)七周成为数据分析师(第六周)—— 统计学

描述统计学

当拿到一份数据时,首先应该怎么做?
在这里插入图片描述
数值数据可以计算,分类数据表示分类,例如男女等。二者可以相互转换,例如年龄的数值数据可以转换为中年、青年等分类数据。

分类数据描述统计

频次统计:单纯对各分类计数就可
在这里插入图片描述
频数百分比:单纯对各分类计数就可
在这里插入图片描述

数值数据描述统计

统计度量和图形
统计度量:

  1. 平均数
  2. 中位数 :平均数大于中位数时,说明数据不均衡,较大的数据较多。
  3. 众数
  4. 分位数
    在这里插入图片描述
    可以结合二八法则,计算前20%的数据,rank,然后取count的0.2。
  5. 方差 :均值和中位数相同时,看方差,方差越大,波动性越强
  6. 标准差:描述数据的离散程度
  7. 数据标准化
    在这里插入图片描述
  8. 权重预估
    标准化之后做一个简单地累加或者均值
  9. 切比雪夫定理
    在这里插入图片描述
    可用来异常值检测。
    在这里插入图片描述

图形:
在这里插入图片描述

在这里插入图片描述
描述分类数据的,但是可以将数值数据转换为数值数据。直方图可以在箱体图的基础上划分更多的分位值。
在这里插入图片描述
在这里插入图片描述
偏度

在这里插入图片描述
标准型分布
在这里插入图片描述
搜索加载项,加入“分析工具”,本身,分析工具是在数据栏里。

概率

抛硬币:事件{正面,反面},概率:50%
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
贝叶斯定理:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从结果推某个原因的可能性有多大,不仅要知道结果,还要分析原因,针对原因分析事件合理性或者找解决方案。
在这里插入图片描述
参考链接:【秦路】七周成为数据分析师《第六周:统计学》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值