数据分析之统计知识总结

1. 前言


统计学是应用数学的一个分支,主要通过利用 概率论 建立 数学模型 ,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。

2. 统计学中的基本概念


2.1 统计数据的类型


在这里插入图片描述

2.1.1 按计量尺度划分

在这里插入图片描述

2.1.2 按收集方法划分

在这里插入图片描述

2.1.3 按时间状况划分

在这里插入图片描述

2.2 样本和总体


在这里插入图片描述

2.3 参数和统计量


在这里插入图片描述

在这里插入图片描述

2.4 变量


在这里插入图片描述

3 描述性统计


在这里插入图片描述

3.1 集中趋势分析

在这里插入图片描述

3.1.1 众数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.1.2 中位数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.1.3 平均数

在这里插入图片描述

3.1.3.1 算术平均数

在这里插入图片描述
在这里插入图片描述

3.1.3.2 加权平均数

在这里插入图片描述
在这里插入图片描述

3.1.3.3 几何平均数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.1.4 四分位数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.1.5 众数、中位数、平均数的比较、关系以及应用

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.2 离散程度分析


在这里插入图片描述

3.2.1 分类型数据:异众比率

在这里插入图片描述
在这里插入图片描述

3.2.2 顺序型数据:四分位差

在这里插入图片描述

在这里插入图片描述

3.2.3 数据型数据:极差

极差:极差为数据样本中的最大值与最小值的差值:
R =   m a x ( i ) − m i n ( i )   R = \ max(i)-min(i)\, R= max(i)min(i)
是所有方式中最为简单的一种,它反应了数据样本的数值范围,是最基本的衡量数据离散程度的方式,受极值影响较大。

如在数学考试中,一个班学生得分的极差为60,放映了学习最好的学生与学习最差的学生得分差距为60.

3.2.4 数据型数据:平均差

平均差:即,
M d = ∑ i = 1 n ∣ x i − x ˉ ∣ n M_{d} = \frac{\sum_{i=1}^{n}\left |x_{i} -\bar{x} \right |}{n} Md=ni=1nxixˉ

针对分组数据为:
M d = ∑ i = 1 n ∣ x i − x ˉ ∣ f i n M_{d}=\frac{\sum_{i=1}^{n}\left |x_{i} -\bar{x} \right |f_{i}}{n} Md=ni=1nxixˉfi
各变量值与平均值的差的绝对值之和除以总数n,平均差以平均数为中心,能全面准确的反应一组数据的离散状况,平均差越大,说明数据离散程度越大,反之,离散程度越小。

3.2.5 数据型数据:方差或标准差

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

3.2.6 自由度

在这里插入图片描述

在这里插入图片描述

3.2.7 相对位置的度量:标准分数

在这里插入图片描述

3.2.8 相对离散程度:离散系数

在这里插入图片描述
在这里插入图片描述

3.3 分布的形状


3.3.1 偏态系数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

3.3.2 峰态系数

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4. 参数估计与假设检验

4.1 参数估计


4.1.1 估计量与估计值

在这里插入图片描述

4.1. 评价估计量的标准

在这里插入图片描述

在这里插入图片描述

4.1.3 点估计

在这里插入图片描述

4.1.4 区间估计

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.2 假设检验


4.2.1 什么是假设

在这里插入图片描述

4.2.2 原假设

在这里插入图片描述

4.2.3 备择假设

在这里插入图片描述

4.2.4 两类错误

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.2.5 假设检验的流程

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.2.6 双侧检验与单侧检验

在这里插入图片描述

在这里插入图片描述

4.2.7 利用P值进行决策

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.3 一个总体参数的推断


4.3.1 总体均值的推断

4.3.1.1 方差已知或未知:大样本

在这里插入图片描述

在这里插入图片描述

案例 1 : 区间估计
在这里插入图片描述

案例 2 : 假设检验(总体方差已知)
在这里插入图片描述

案例 3 : 假设检验(总体方差未知)

在这里插入图片描述

在这里插入图片描述

4.3.1.2 方差已知:小样本

在这里插入图片描述

案例1:区间估计
在这里插入图片描述

案例2:假设检验
在这里插入图片描述

在这里插入图片描述

4.3.1.3 方差未知:小样本

在这里插入图片描述
在这里插入图片描述

案例1:区间估计

在这里插入图片描述

案例2:假设检验

在这里插入图片描述

4.3.2 总体方差的推断

在这里插入图片描述

在这里插入图片描述

案例1:区间估计

在这里插入图片描述

案例2:假设检验

在这里插入图片描述

在这里插入图片描述

4.3.3 小结

在这里插入图片描述

4.4 两个总体参数的推断


在这里插入图片描述

4.4.1 方差已知或未知:大样本

在这里插入图片描述

在这里插入图片描述

案例1:区间估计

在这里插入图片描述

4.4.2 方差未知但相等:小样本

在这里插入图片描述

案例1:区间估计

在这里插入图片描述

在这里插入图片描述

4.4.3 两个总体均值之差的估计:小样本

在这里插入图片描述

案例1:区间估计

在这里插入图片描述
在这里插入图片描述

案例2:假设检验

在这里插入图片描述

在这里插入图片描述

4.5 多个总体参数的推断


在这里插入图片描述

4.5.1 方差分析

4.5.1.1 什么是方差分析

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.5.1.2 方差分析中的相关术语

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.5.1.3 方差分析的思想和原理

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4.5.1.4 方差分析中的基本假定

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.5.1.5 方差分析问题的一般提法

在这里插入图片描述

4.5.2 单因素方差分析

在这里插入图片描述

在这里插入图片描述

4.5.2.1 提出假设

在这里插入图片描述

4.5.2.2 构造检验统计量

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.5.2.3 统计决策

在这里插入图片描述

4.5.2.2 方差分析表

在这里插入图片描述

4.5.2.4 关系强度的测量

在这里插入图片描述
在这里插入图片描述

4.5.3 方差中的多重比较

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.6 多分类数据频数的检验——卡方检验


  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值