轻松学统计--中国mooc2

频数分布:初显总体分布特征

统计资料通过统计分组后就形成统计数列。
一、统计数列分类
1.按品质标志分组形成品质数列。
2.按数量标志分析形成变量数列。

二、变量数列分类和构成
1.变量数列的分类
(1)单项式数列:用一个变量值表示一个组的数列。通常只适用于离散变
量,且在变量值较少的情况下使用。这种分组在实际中应用的较少。
(2)组距式数列:用一个区间表示一个组的数列,实际中使用较多。

 

2.变量数列构成的基本要素
(1)变量和次数(频数)
(2)变量和比率(频率)

 

三、变量数列编制方法
1.组限:上组限(U)、下组限(L)。
2.组距(i)= U–L。
3.全距(R)=Xmax–Xmin=变量的最大值-变量的最小值
[例]某班某门课的考试成绩最高为98分,最低为45分
R=53分
4.组数(n)=全距/组距=R/i

但是如果全部数据中的最大值和最小值与其他数据相差悬殊,在组距式数列中,为避免出现空白组(即没有变量的组)或个别极端值被漏掉,第一组和最后一组可以采取“xx以下”或“xx以上”这样的开口组。如上述例子采用开口组的形式可表示如下:

 

6.次数密度= 次数/组距
[例]第三组:13人/10分=1.3人/分。
7.对连续变量,只可编制组距式数列,且相邻组限必须重叠。
8.对重叠组限,组限值单位数遵循“上组限不在内”的原则。
组限值单位:取值正好是某组组限(上限或下限)的单位。
[例]第二组的取值范围[90、100);
第三组的取值范围[100、110)。
第五组的取值范围[120、130]。

9.组距式数列不仅可用于上述的连续型变量,它还适合于变量值较多的离散型变量。

 

上述要注意的是使用组中值代表一组数据有一个必要的假定条件,即各组数据在本组内呈均匀分布或在组中值两侧呈对称分布,如果实际数据的分布不符合这一假定,则组中值作为一组数据的代表值会有一定的误差。

一般为了统计分析的需要,有时我们还需要观察某一数值以下或某一数值以上的频数或频率之和,还可以计算出累积频数累积频率

 

统计图表:展现数据最佳拍档

一、统计表
统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据。把这些数据按一定的顺序排列在表格中,就形成“统计表”。
统计表是表现数字资料整理结果的最常用的一种表格。
统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式。

二、统计图
(一)直方图
1.用于展示分组数据分布的一种图形
2.用矩形的宽度和高度来表示频数分布
---本质上是用矩形的面积来表示频数分布
3.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图
4.直方图下的总面积等于1
(二)条形图
1.用宽度相同的条形的高度或长短来表示各类别数据
2.各类别可放在纵轴,也可以放在横轴,纵置时也称为柱形图(columnchart)

(三)累积频数图

所谓累积频数即到某个特定数值为止的总频数,也就是频数的累积总和。一般我们在计算累积频数(次数)时采用向上累计和向下累计的方法。

(四)饼图
用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,用于研究结构问题。

(五)折线图

折线图常用于显示随时间变化的数值,一般需要体现趋势时才使用折线图(如基于时间的趋势)。

(六)曲线图

1.钟形分布
特征:中间大、两头小。
[例]身高、体重、智商、纤维长度、细纱强度、粮食作
物产量等。
(1)对称分布:正态分布及t分布。
(2)偏态分布(不对称分布)

A、右(正)偏有极大值;
B、左(负)偏 有极小值。

 

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值