第一个问题,连续变量是什么?
一个人的年级,统计出来有1、2、3……
一个人的年纪,统计出来有18、19、20……
但是,虽然都是数字,只有年纪是连续变量。
为什么?顾名思义,年纪是连续的,18 - 19之间可以无限划分,而年级不行,你只能位于这几个数之间的一个,而不能在他们中间。
所以我们定义连续变量为:在一定区间内可以任意取值的变量。
下面进入正题,连续变量的描述统计。
概述
对于统计学和SPSS来说,描述统计很直观,非常适合入门,它的作用就是进行描述。
描述一组数据,最普及的当然是平均数了,它属于集中趋势的量数,那么在数据工作中,我们可以从以下几个方面对数据进行描述:
- 集中趋势 central tendency
- 离散趋势 dispersion tendency
- 分布特征 distribution tendency
下面一个个介绍
集中量数
它用来体现一组数据的一般水平,集中意为数据们向某一点集中,众数据奔它而来。
这一点并不固定,我们会根据数据的不同分布状况进行选择,比如:
- 算术平均数:观察值总和与总频数之商;这是最常用的指标,但不适合对严重偏态分布的变量进行描述。譬如一个很常用的