![8292827d5e625d89288e8dee8d165009.png](https://i-blog.csdnimg.cn/blog_migrate/51a9e2c579d2e5356f3f833a455b6390.jpeg)
课程目录
![acf9a6eca21c60f5b5ab2b206b70656a.png](https://i-blog.csdnimg.cn/blog_migrate/3bd7aea827af2d3665dbf8eef3662d53.jpeg)
第一章 绪论
1.1什么是统计学?
统计学研究对象是带有随机性的数据,为了对数据进行定性、定量的分析,首先需要建立合适的统计模型,再利用模型研究总体数量表现得内在规律性。
1.2统计学的产生与发展(自己找的)
统计学的历史与今天 | 统计之都cosx.org1.3统计学的方法
1.3.1统计学方法
- 抽样调查法:简单随机抽样、普查……
- 试验设计法:自然科学、工程技术领域……
- 描述统计法:统计表、统计图……
- 统计调查法:参数估计、假设检验、相关与回归……
1.3.2统计学基本概念
- 总体、样本和个体;平均数、众数、方差……
- 统计量、估计、正态分布、卡方分布、t分布……
1.4excel数据分析功能(安装数据分析工具;略)
第二章 数据的收集与整理
2.1数据的收集
2.1.1数据类型
数据类型-1(课程)
![55a4a89ae76edead13787f870b316617.png](https://i-blog.csdnimg.cn/blog_migrate/8170b2aef5a8853dc97edf57d354c761.jpeg)
数据类型-2(网页)
![8056649e2d4ac1972b97189f3cbe8054.png](https://i-blog.csdnimg.cn/blog_migrate/00c6441c02444d0c2ad1add6d4b44931.jpeg)
※定性数据定量化处理
2.1.2统计调查方法
1.普查:为特定目的专门组织的非经常性的全面调查。
2.抽样调查:
- 从总体中随机抽取部分样本进行调查
- 最常用的调查方式
- 目的是推断总体的未知数字特征
- 经济型、时效性、广泛性、准确性等特点
3.重点调查与典型调查(不常用)
- 重点调查:从调查对象中选择少量重点单位调查,调查结果不能用于推断总体。
- 典型调查:选择少数典型单位调查,描述和解释事物的本质特征和规律,不能用于推断总体。
4.统计报表:统计调查方式之一,是我国主要的数据收集方式,自上而下的统一布置,自下而上的提供统计数据。
5.查阅统计资料
2.1.3问卷调查统计方法
- 调查目的(具体目标,为什么……)
- 确定调查对象和单位
- 设计调查项目和调查表
- 方案设计中的其他内容
2.2数据的整理
2.2.1数据整理的内容
1.统计数据整理的程序
- 审核原始数据
- 分组和汇总
- 做出统计图
2.统计数据整理的内容
- 设计整理汇总方案
- 通过统计表、统计图的形式,显示整理结果
2.2.2数据整理的方法
- 表格法:交叉分组列表,一维表,二维表
- 图示法:条形图,直方图,饼图
- 直方图:
①按照经验公式确定分几组(组数)
![cf64fd3b74adcf3a6f1a29f6a5915339.png](https://i-blog.csdnimg.cn/blog_migrate/cdd390ac40e4f1ccd85353013a1bf901.png)
②确定组距
组距=(max-mini)/组数
![b9324be984d2344892f7d8c4141ad095.png](https://i-blog.csdnimg.cn/blog_migrate/1a64a972fda5340d6845b59328d6337c.jpeg)
第三章 数据的特征
3.1数据的集中特征
3.1.1中位数(Me)
- 集中趋势的测度值之一
- 排序后处于中间位置上的值
- 不受极端值的影响
- 可用于定序数据,数值型数据,不可用于定类数据
- 计算公式 Me = 居中的数 (n为奇数)or 居中的两个数的平均数 (n为偶数)
- 对于任意常数C,有
![50dd541e44ae031fb4cd938a1f37765f.png](https://i-blog.csdnimg.cn/blog_migrate/4c2e750ecc125bd0f1868dc35e82b54a.png)
- excel操作:公式-统计-median(中位数函数)
3.1.2众数(Mo)
- 集中趋势的测度值之一
- 出现次数最多的变量值
- 不受极端值的影响
- 可能没有众数或有几个众数
- 主要用于定类数据,也可用于定序数据和数值型数据
- excel操作:公式-统计-mode(众数函数)
3.1.3平均数
- 集中趋势的测度值之一
- 最常用的测度值
- 一组数据的均衡点所在
- 易受极端值的影响
- 算术平均值;调和平均;几何平均
①算术平均值(avg)
Ⅰ设一组数据X1,X2,X3……Xn,平均值的计算公式
![4c6206fe1e13bd8ed3d39ecefbb4bde2.png](https://i-blog.csdnimg.cn/blog_migrate/c1626fe5219d75cf1a7999028b693d8c.png)
Ⅱ设分组后数据X1,X2,X3……Xk;相应的频数为F1,F2,F3……Fk;加权平均值的计算公式
![7af3c340aabb704d3978b7462391d545.png](https://i-blog.csdnimg.cn/blog_migrate/ce311e6c9b3a9ec5998a4937b8aafe67.png)
- excel操作:公式-统计-average
②调和平均数(Hm)
- 集中趋势测量值之一,将所有数值取倒数并求其算术平均数后,再将此算术平均数取倒数而得,其结果等于数值的个数除以数值倒数的总和。
- 均值的另一种表现形式,一般是在计算平均速率时使用
- 易受极端值的影响
- 用于定比数据
- 不能用于定类数据和定序数据
Ⅰ简单调和平均数,一组正数x1, x2 ... xn的调和平均数H其计算公式为:
![20c9cfdca1d86574b5f6272ea80a8839.png](https://i-blog.csdnimg.cn/blog_migrate/2e6376dfaaef89ff1ca4e173bb74c780.png)
![7127965755c058c7c70b5d3ac7fa51b3.png](https://i-blog.csdnimg.cn/blog_migrate/cab6fd10a4f3f2708a2a6a5054abf367.png)
Ⅱ加权调和平均数
![512e7450ffdebcc70af615169b2ff99a.png](https://i-blog.csdnimg.cn/blog_migrate/f27a27a0368e03d3fde818d971ab24a7.png)
- excel操作:公式-统计-harmean(调和平均值)
③几何平均(Gm)
- 集中趋势的测度值之一
- n个变量值乘积的n次方根
- 适用于特殊的数据
- 只要用于计算平均发展速度
Ⅰ简单几何平均值
![41224790e642441446c106a1a00f6b6a.png](https://i-blog.csdnimg.cn/blog_migrate/1630a70af2825c8948e587de545fb8ad.png)
Ⅱ加权几何平均值
![6c410ba73500c9c287133742b0cde005.png](https://i-blog.csdnimg.cn/blog_migrate/75cb6c78cf5354deb6cf5b00cde315d8.png)
- excel操作:公式-统计-geomean(几何平均)
3.1.4众数、中位数和均值的关系
![1751a1c5fc907d127760c593892d2335.png](https://i-blog.csdnimg.cn/blog_migrate/9b2ee13fb84b2db157455fb08a16e375.jpeg)
规律:中位数在中间,均值最小是左偏分布,均值最大是右偏分布。
3.2数据的离散特征
3.2.1异(不同于)众(众数)比率
- 解释:设观察数据n个,众数m个,则定义异众比率为
![2147833e773acab1c8d3c0971ff24060.png](https://i-blog.csdnimg.cn/blog_migrate/7fceee4362113414e0aff7c72f42deec.png)
![31f7e1fab36c753f449eb37be2c3ccab.png](https://i-blog.csdnimg.cn/blog_migrate/f1fb20d22dd705bf8e7a7be3b607aae7.png)
2. 性质:①异众比率越小,说明众数占比越大,数据越集中。②异众比率越大,离散程度越大。
3.2.2极差
- 一组数据最大值与最小值之差
- 离散程度的最简单测度值
- 易受极端值影响
- 未考虑数据的分布
- 计算公式
![91dd86378a0b7f693dd71fdfe78d2f3c.png](https://i-blog.csdnimg.cn/blog_migrate/420580a46947c9303c5aa9cfbd5963a2.png)
![b653f988603af609baf3f29664b4993f.png](https://i-blog.csdnimg.cn/blog_migrate/ebfdb305c61a217256847428f42674de.png)
3.2.3方差和标准差
- 离散程度测度值之一
- 最常用的测度值
- 反映了数据的分布
- 反映了各变量值与均值的平均差异
- 根据总体数据计算的,称为总体方差或标准差
![5e8b76cd79f22475c703df148c975ed2.png](https://i-blog.csdnimg.cn/blog_migrate/a937209835f1879aced65c1f084b969a.png)
![ef28bf9bc40d5ffb47146887dba51f49.png](https://i-blog.csdnimg.cn/blog_migrate/fccff482b403f9b6c72250e2ce9a0740.png)
6. 根据样本数据计算的,称为样本方差或标准差
![7b775e732355643a234b41b039a98306.png](https://i-blog.csdnimg.cn/blog_migrate/dc379642f080c938a3611ca68f1339ad.png)
![d1c1ede1ad7eba2e1b256acf928a9a08.png](https://i-blog.csdnimg.cn/blog_migrate/09efda6c67fb59165e557d69463b2305.png)
7. 方差的性质:设Xo为不等于平均数,D^2为对Xo的方差,则
![7bcb6fb3d89da964d90af4236fc01d26.png](https://i-blog.csdnimg.cn/blog_migrate/a0c4076ed2fcf5edfd566bf39383c906.png)
- excel操作:公式-var函数(样本方差)
- 公式-varp函数(总体方差)
3.2.4标准化值(标准分)
- 给出某一个值在一组数据中的相对位置
- 可用于判断一组数据是否有离群点
- 用于对变量的标准化处理
- 计算公式:
![5a912f6a43171c584138b532ccf196eb.png](https://i-blog.csdnimg.cn/blog_migrate/a3cb7d83fd30b7649c51f05d8fe97e73.png)
![955a496b953808dcc084762481f0514d.png](https://i-blog.csdnimg.cn/blog_migrate/82b79233aa5cce6b71d960beeeda3224.png)
3.2.5离散系数
- 标准差与其对应的均值之一
- 消除了数据水平高低和计量单位的影响
- 测度了数据的相对离散程度
- 用于对不同组别数据离散程度的比较
- 计算公式:
![1b0591ef4b216e99c279be4e8df4e68b.png](https://i-blog.csdnimg.cn/blog_migrate/eddc1dc257728836d6f16a07e5b8ec5a.png)
![3c7a49f4d55ca9ec715f2e113b3ee442.png](https://i-blog.csdnimg.cn/blog_migrate/bb5c7a65e4dcc24c76cd8d2e53d6042a.png)
3.3数据分布形状特征
3.3.1分布的偏态
![1751a1c5fc907d127760c593892d2335.png](https://i-blog.csdnimg.cn/blog_migrate/9b2ee13fb84b2db157455fb08a16e375.jpeg)
- 数据分布偏斜程度的测度
- 偏态系数=0对称分布
- 偏态系数>0为右偏分布
- 偏态系数<0为左偏分布
- excel操作:skew(偏态)
3.3.2分布的峰度
![3c2a9fa8bdcd7462c5001c9c010d1619.png](https://i-blog.csdnimg.cn/blog_migrate/c81841fb15f26b75a0e5b83432945c4c.jpeg)
- 数据分布扁平程度的测度
- 峰度系数=3常峰态
- 峰度系数<3扁平分布
- 峰度系数>3尖峰分布
- excel操作:Kurt(峰度)