CDA Level 1 数据分析师:4.3 推断统计

CDA Level 1 数据分析师:4.3 推断统计

1. 经验法则:
	X~正态分布
	68%落在μ±σ范围内
	95%落在μ±2σ范围内
	99%落在μ±3σ范围内
2. 切比雪夫不等式
	1. 75% 落在μ±2σ范围内
	2. 89%落在μ±3σ范围内
	3. 93%落在μ±4σ范围内
3. 参数估计:已知模型或假定系统的模型,估计总体参数
	1. 估计量:关于样本的一个函数(如样本均值、样本比例、样本方差)
	2. 估计值:带入数据,计算出数值
4. 确定需要估计的参数:
    1. 总体均值:单个总体,或两个均值差
    2. 总体比例:同上可单个,可两个
    3. 总体方差:同上

总体均值估计:
    1. 如果总体均值服从正态分布,则从总体抽样时也会是正态分布。
    2. 总体不是正态时,可任意分布。中心极限定理:样本均值会随着样本量大趋近于正态分布。注意是  样本均值,从整体抽取多个样本后求均值。总体的均值μ,方差σ2。则样本均值为μ,方差σ2/n,标准差σ/√n
    3. 两个样本均值的差也是正态分布
    4. 两个样本的比例也是正态分布
    5. 一个样本的方差 用卡方分布
    6. 两个样本方差之比  用F分布
5. 估计量的评价标准:
    1. 无偏性:研究总体均值,求样本均值,进行无数次样本均值估计,如果样本估计的均值 等于 总体均值,则称为无偏性
    2. 有效性:方差越小,估计越有效
    3. 一致性:样本容量增大,估计量值越来越接近总体参数
 6. 点估计和区间估计
     区间估计:
         1. 置信水平:表示准确度有多高,一般取95%
         2. 一般使用T估计

相关分析:

  1. XY在某种程度上相关
  2. 相关类型:
    1. 变量数量:1. 单相关 2. 复相关
    2. 表现形式:1. 线性相关 2. 非相关
    3. 变量关系方向:1. 正相关 2.负相关
    4. 产量相关程度:1. 完全相关 2. 不相关 3. 不完全相关
  3. 相关度量:协方差
    1. COV>0,XY正相关
    2. 反之亦然
    3. Cov=0,XY无关,图像是圆形
    4. 变量自己和自己的协方差,就是方差
    5. X,Y的相关系数Cor:协方差除标准差的乘积
    6. 相关系数绝对值越趋近1,则表明这两个关系更大,如果等于0,相关性很小
    7. 相关系数非常受到离群值影响
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一只小Demo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值