在上一篇文章《统计基础:【19】数据类型与测量尺度》中,留下了练习题参考答案在此公布。
首先把题目内容再展示一遍:
识别下列各数据集的数据类型与测量尺度
a. 篮球队球员队服上的号码。
b. 学生对自助餐厅食物的等级设定为非常好、好、一般、不好。
c. 某个历史事件的年份,如1776、1945、2001。
d. 摄氏温度
e. 波士顿马拉松比赛中运动员的长跑时间。
现在公布答案:
a. 队服上的数字并不是用来计数或测量的。它是定类测量的教据,因为这些教字只是队员的标记,没有顺序之分。身份证号也是如此。
b. —组等级所代表的数据是定序测量的数据,因为这些类别(非常好、好、一般、不好)有确定的顺序。
c. 间距为一年的年份数所代表的意思是一样的,但不同年份的比例没有意义,因为年份的零值是任意的,并不代表时间的起始值。因此,日历年份是定距测量的数据.
d. 和华氏温度一样,摄氏温度也是定距测量的数据,只有开氏温度才是定比测量数据。
e. 马拉松比赛所用时间的比例是有意义的,因此比赛时间属于定比测量数据。
误差可以分为两种类型:随机误差和系统误差。
随机误差:是由测量过程中存在随机的以及固有的不可预知的事件导致的误差,随机误差不可纠正。
系统误差:是由测量系统存在问题而引起的误差,且这个问题一直以相同的方式影响所有测量结果。系统误差是有可能消除或降低的。
校准误差:测量刻度与真实值之间存在差异的系统误差。
案例说明
假设你在儿科工作,要使用电子秤测量婴儿的体重。如果你接触过婴儿,你会知道他们不愿意被放在秤上,婴儿的强烈摆动和哭闹会使秤不停晃动,使得显示器上的数字不停跳动。你可能会将这个婴儿的体重记录为2500-4000克之间的任何一 个数。我们说秤的晃动产生了一个随机误差,因为任意的测量值都可能过高或过低。但是你可以通过重复测量取平均值使随机误差最小化。
现在假设你已经用秤称了一天婴儿的体重。在这一天结束时,你注意到秤空时仍显示读数150克,这种类型的误差被称为系统误差,因为它是由测量系统的错误引起的,并影响所有测量结果。
对于校准误差,你可以将一个已知重量的物品放在秤上来对其进行校准,如重量分别为 50g、100g、200g、500g、1000g的物品,并且确定这个秤能显示预期的读数。
误差大小的度量
绝对误差:测量值与真实值之间的差距
相对误差:将绝对误差的大小与真实值相比,通常表示为百分比
注: 当测量值大于真实值时,绝对误差和相对误差都是正数;而当测量值小于真实值时,绝对误差和相对误差都是负数。
案例说明
假设钢管厂订购了100吨镍板,但实际只收到了99.9吨货物;而你去菜市场买了两斤肉,回家一称发现只有1斤。
在不考虑价格的前提下,表面上看,0.1吨镍板的绝对误差比1斤猪肉的绝对误差要大。但其实一斤猪肉的相对误差却更大,因为1斤的绝对误差是真实重量2斤的一半,相对误差为50%;相比较而言,钢管厂0.1吨镍板的相对误差仅为0.1%。
本文节选自《妙趣横生的统计学》课程,
如果想要学习更多的统计学知识,
可以点击文末阅读原文,
学习视频版内容!
往期回顾
统计基础:【16】(Meta analysis)综合分析简介
统计基础:【17】你的统计研究可信吗?
统计基础:【18】使用Excel和R语言来实现抽样
统计基础:【19】数据类型与测量尺度