两组数据的偏差率_数据分析用的“平均值”,并不平凡(深度理解统计)

· 帮助业务人员分析业务时选择合适的指标

· 帮助数据人员理解采用的数据指标的原理


平均值和比例具有相同的本质

平均值和比例的本质含义是集中趋势

我们常常通过数据统计的平均值,来反映一组分散数据的真实状况。就是这个我们几乎每个人都会用的平均值,在它的背后存在着比统计学思维更早的深刻思考。接下来你将惊异到,这看似简单的值背后的思考竟如此复杂。

通常用数字来描述的量化的信息可以称为定量变量,对于不是数字而是用数字文字描述的非定量的信息称为定性变量。定量变量用来描述数量上的大小,定性变量用来描述性质上的不同。

3e79cfbe34f3893b6a43d664cb530b8c.png

那么为什么说平均值和比例具有相同的本质呢?

举个例子,调查100个人职业有30个学生,20个教师,50个职员。学生、教师、职员是作为定性变量,统计的人数的数字是定量变量。可以很容易得出学生的占比是30%,这是一个比例。

我们把定性变量转换成定量变量,调查100个人职业中“学生的程度”,也可以“学生的趋势”,得到的结果要么是,要么不是。

bcf8f645ff082caf926b3b759e1ccc36.png

我们将是学生赋值为1,反之赋值为0,统计后会得到30个1和70个0,平均值是0.3。同理,教师的占比是20%,教师的程度的平均值是0.2。

可以将这种同时具有定性变量和定量变量特征的,可以量化的定性变量作为一种特殊变量情况来处理。这种只能取到1和0两个值的变量,被称为二值变量。

可以说

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值