统计学---数据的标准化

北京2017年中考科目有6门,其分值分别是语文120,数学120,外语120,物理100,化学80,体育40,总分580分。

那么问题来了,数学考了100分就一定比物理考了90分强吗?语文100分与外语100分的含金量是一样的吗?

我们假设拿到了10位同学的英语和语文成绩,如下表所示

序号英语语文
110985
2108108
38895
411684
510280
69679
78972
8100100
97268
1088102
平均分96.887.3

我们看到,英语100分,离平均值96.8较近,略高于平均分;而语文100分,离平均值87.3较远,且远高于平均分;因此同样是考100分,但各自的含金量是不同的,显然语文考100分的含金量更大。

我们假设再拿到了10位同学数学和英语的成绩,如下表所示

序号英语数学
1109119
2108118
38888
411678
510268
69699
789115
8100100
97291
108892
平均分96.896.8

2门科目的平均分是一样的,都为96.8,那么英语和数学都是100分的含义是一样的吗?

我们算一下英语和数学2门科目的标准差,英语科目的标准差是:12.29;而数学科目的标准差是:16.14。

前期的文章《统计学—掌握数据的整体状态》提过,标准差越小,代表这组数据的“离散程度”也越小,换句话说,比起数学,大家在英语科目上的成绩更为接近,也就是说,在英语科目中的1分价值更高,因为可能甩开更多的人,会大大影响排名。所以,在2门科目平均分一样的情况下,英语的100分比数学的100分含金量更高。

那么,结合平均值和标准差这2个指标,可以通过”标准化(standardization)”来比较2个不同种类的数值。其计算方法是:

=

我们算一下,语文、英语、数学3门科目都是100分时的标准计分:
三门课的平均值分别是:87.3,96.8,96.8;标准差分别是:12.69,12.29,16.14。

那么:

=10087.312.69=1.0

=10096.812.29=0.26

=10096.816.14=0.198

这说明同是100分,语文的含金量最高,其次是英语,最后是数学。

标准计分有2个特点:一是平均值为0;二是标准差为1。这个从上面的公式就可以推导出来。

有了标准化,满分100分和满分120分的科目就可以进行比较了;甚至数据的单位不同,也可以进行比较了。

  • 11
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值