1. 数据获取
1数据来源
简单随机抽样:N个元素抽n个,每个元素概率相同
重复:重复抽样 不重复:不重复抽样;得到的样本:简单随机抽样分层抽样:先分若干层,然后再在每层抽(生活费支出,先按地区分层)
系统抽样:固定时间间隔抽样,学生名册抽样
整群抽样:群作为抽样单元,一个宿舍作为一个群,全校宿舍中对宿舍抽样
2.1 频数分布表
频数:在某类别的数据个数
连列表/交叉表:一个变量在行位置,一个在列位置
频数分布表:120天销售额数据
一.分组: 5<=k<=15 组距:(最大值-最小值)/组数
2.a<=x<b 上限不属于本组,属于下一组
条形图定性数据,直方图定量数据,可以看出接近正态分布
二. 未分组数据
茎叶图
箱线图
中位数, 四分位数 Q25%,Q75%, 四分位距 Q75%-Q25%
垂线图
误差图— 以均值为中心,加减一定倍数(2倍)的标准差
三.变量之间关系:散点图
有明显线性关系
四,比较多样本相似性:雷达图,轮廓图
横轴:各个样本 纵轴:各个样本取值