目录
第一章 绪论
1.
答案:D
数据按照计量尺度分可分为”分类数据“和”数值数据“
分类数据:只能归于某一类的非数值型数值,根据取值是否有序可分为无序分类数据和有序分类数据
数值数据:具体的数值,根据取值情况可分为离散数据和连续数据,离散数据的取值是有限的;连续数据的取值固定在某一区间,且该区间的数值连续不断
2.
答案:A 解析看上
3.
答案: B
总体为B,样本为A,参数为D,统计量为C
注意:”参数“针对 ”总体“;”统计量“针对”样本“
4.
答案:A
5.
答案:C
截面数据:在同一个时间点的多个数据!!!
6.
总体为所研究个体的集合!!参数是总体的某种特征值!!
7.
研究的个体为高中学生,则总体是所研究个体的集合!!
样本为D
8.
描述统计:通过一些图表,收集全部研究对象的数据进行分析
推断统计:利用样本数据来推断总体特征
9.
只能归于某一类的非数字型数据
10.
11.
12.
13.
14.
第二章 数据的搜集
1.
二手数据采集成本低且搜集比较容易
2.
概率抽样:
1)简单随机抽样:从N个中抽n,每一个被抽概率相同。
2)分层抽样:按某种规则划分为不同层,在每个层中随机抽取样本。
3)整群抽样:将总体中若干个单位合成群,直接抽群,然后对群的每个人进行调查。
4)系统抽样:预先制定抽取规则,然后随机抽一个,接下来按照规则抽样。
班级的一个群,然后对群里的所有人调查,因此是整群抽样
3.
非概率抽样(总体中不是每个个体都有被抽中的概率!!):
1)方便抽样:采取方便调查者的调查方法进行抽样
2)判断抽样:根据调查者的经验,有目的的采取抽样
3)自愿抽样:被调查者自愿参加
4)滚雪球抽样:由被抽样者提供新的抽样者
5)配额抽样:类似概率抽样中的分层抽样
就地取样,方便调查者
经验法则
只有概率抽样才可以进行参数估计
判断抽样是有目的性的,明确的方向性的
4.
概率抽样与非概率抽样的比较:
非概率抽样:因为不依据随机原则抽取样本,因此样本统计量的分布是不确定的且无法对总体进行参数估计;优点是方便简单、成本低、时效快。适合于探索性研究
概率抽样:与上相反
5.
搜集数据的方法有:自填式、面谈、电话、实验
6.
因为样本是随机抽取的!!!!
7.
概率抽样也可能存在非抽样误差
8.
9.
10.
回答误差中的一种,回答误差包含理解误差、记忆误差、有意识误差
11.
误差控制:
抽样误差是无法避免的,但可以控制!
非抽样误差是可以避免的!!
第三章 数据的图表展示
1.
数据筛选:数据的预处理!!
2.
3.
比率的定义!
4.
饼图能直观的描述各部分的占比,因此最适合描述结构性问题
5.
环形图是多个饼图的叠加!!
6.
7.
8.
直方图是以区间作为横坐标,因此适合描述大批量数据
9.
10.
能直观展示随着时间推移其变化趋势
11.
散点图:展示两个数值变量之间关系的图形!!
12.
气泡图用于三个变量之间的相关关系,是散点图的升级版
13.
14.
有重复数据,因此不能用散点图!!!
15.
茎叶图只能用于描述数值数据
16.
累积频数分布图是对前面的进行叠加
17.
参考其他区间完整的组别的中位数距离两端的距离
18.
直方图用于描述数值数据,不能描述分类数据
第四章 数据的概括性度量
众数用于描述数据的集中趋势度量,其可能不存在,也可能有多个,且不受极端值影响!
上四分位数是75%位置的数
数据对称分布:经验法则
68%的数据在平均数加减一个标准差内
95%的数据在平均数加减两个标准差内
99%的数据在平均数加减三个标准差内
数据不对称分布:切比雪夫不等式
75%的数据在平均数加减两个标准差内
89%的数据在平均数加减三个标准差内
94%的数据在平均数加减四个标准差内
有1200名经济管理学院的学生!!!!因此众数是经济管理学院
中位数适合作为顺序数据的集中趋势测度值!!!
众数适合作为分类数据的集中趋势测度值
平均数适合作为对称数据的集中趋势测度值
第六章 统计量及其抽样分布
统计量:由样本构成的一个函数,不含有任何未知参数!!(E(X)为依赖于总体的未知参数)
中心极限定理
总体分布不是很偏的情况下,样本量足够大(n>=30)则样本均值近似服从正态分布
总体服从正态分布,所以样本均值的抽样分布仍为正态分布,数学期望不变,均值的方差=总体方差/样本量,因此,样本量越大,均值的方差越小!!