CDA Level 1 数据分析师:4.1 统计的基本概念
1. 统计学的含义
统计学是一门收集、处理、分析、解释数据并从数据中得出结论的科学。
1. 统计学分析数据分类:
1. 描述性分析:研究数据收集、处理后进行分析:总体规模、对比关系、离散程度、偏差、峰值
2. 推断性分析:总体情况不可知,只能从样本中推断总体:估计、假设检验、方差分析、相关分析、回归分析
2. 统计学基本概念:数据
1. 统计学对象是数据
2. 数据形式:1. 数字(可进行比较和运算,阿拉伯数字表示)
2. 文字:如男女
只要可以分析,那都是数据,不管是不是数字还是文字,还是其他描述。
3. 计量尺度分类:1. 分类型数据:不可排序和计算(中国美国男女)
2. 顺序型数据:可排序,不可计算。对事物类别顺序测量(一等品、二等品、三等品,很重要的,消费性数据:如喜欢吃西瓜、不喜欢吃菜花)
3. 数值型数据:可排序、可计算(175cm,60kg)
区间:数值型数据
4. 数据来源:1. 直接来源 2. 间接来源
5. 按收集方式不同:1. 观测型数据 2. 实验的数据
6. 按时间的关系不同:1. 截面数据(一个时间点或段) 2. 时间序列数据(过去的事影响现在或未来的情况) 3. 混合数据(时间、地点相互响应,如天津北京一月销量和二月销量分析)
7. 按照概型:离散型、连续型
3. 统计学基本概念:总体和样本
总体是定值,样本是变量
总体:所有元素的集合,每个元素称为个体
如:全校的平均年龄
样本:从总体抽取的一部分元素的集合。
如:全校的学生太多,抽取100人研究
构成样本元素的数目称为样本容量
4. 统计学基本概念:参数和统计量
1. 参数:总体的某种特征:总体均值,总体标准差
2. 统计量:样本的某种特征,样本计算出来的一个量:样本均值,标准差