· 帮助业务人员分析业务时选择合适的指标
· 帮助数据人员理解采用的数据指标的原理
平均值和比例具有相同的本质
平均值和比例的本质含义是集中趋势
我们常常通过数据统计的平均值,来反映一组分散数据的真实状况。就是这个我们几乎每个人都会用的平均值,在它的背后存在着比统计学思维更早的深刻思考。接下来你将惊异到,这看似简单的值背后的思考竟如此复杂。
通常用数字来描述的量化的信息可以称为定量变量,对于不是数字而是用数字文字描述的非定量的信息称为定性变量。定量变量用来描述数量上的大小,定性变量用来描述性质上的不同。
![3e79cfbe34f3893b6a43d664cb530b8c.png](https://i-blog.csdnimg.cn/blog_migrate/d28c538c92de6072b5820660efaa1247.jpeg)
那么为什么说平均值和比例具有相同的本质呢?
举个例子,调查100个人职业有30个学生,20个教师,50个职员。学生、教师、职员是作为定性变量,统计的人数的数字是定量变量。可以很容易得出学生的占比是30%,这是一个比例。
我们把定性变量转换成定量变量,调查100个人职业中“学生的程度”,也可以“学生的趋势”,得到的结果要么是,要么不是。
![bcf8f645ff082caf926b3b759e1ccc36.png](https://i-blog.csdnimg.cn/blog_migrate/6446d7b7d21e4f93895824763fb906b9.jpeg)
我们将是学生赋值为1,反之赋值为0,统计后会得到30个1和70个0,平均值是0.3。同理,教师的占比是20%,教师的程度的平均值是0.2。
可以将这种同时具有定性变量和定量变量特征的,可以量化的定性变量作为一种特殊变量情况来处理。这种只能取到1和0两个值的变量,被称为二值变量。
可以说