定量变量:变量按照随机规律所取的值是数量时,该变量称为定量变量,或数量变量、随机变量。
定性变量:像性别或观点之类的取值非数量值的变量就称为定性变量,或分类变量、属性变量。
当然,定性变量也可以用定量变量来描述,比如男生的人数、比例等,定性变量只有用数量描述时,才能建立数学模型,使用计算机来分析。
用数字概括数据
生活中人们常常会用几个数字概括大量数字,比如杭州人的平均收入是多少,北京和上海两地区的收入差距是多少,中国男性的平均身高是多少等等。这些“平均”,“差距”就是用来概括汇总的数字。
常用概括统计量(汇总统计量)如下:
1、位置统计量(和“位置”有关的统计量)
(1)算术平均值/均值/样本均值 特点:容易被极端值影响
(2)(样本)中位数:数据按照从小到大排序后位于中间的那个数(样本量为奇数),或中间两个数的平均值(样本量为偶数)。 特点:不易被极端值影响,比均值稳健
(3)上下四分位数:数据从小到大排序后,位于数据上下四分之一的地方,上四分位数又称为75百分位数,下四分位数又称为25百分位数。
(4)众数:一组数据中出现次数最多的数值。有时候在一组数据中有好几个众数。
2、尺度统计量(描述数据集中于分散程度的度量)
(1ÿ