数据类型分类

一般我们都知道数据可以基本分为两类,定性和定量数据。
今天在整理相关系数的时候,看到一篇分析说,数据可以分为定距、定类、定比和定序四类,不同种类的数据适用不同的相关系数。在这里做个总结。

1.定类变量 Nominal Variable
这个容易理解,就是给数据分门别类,一般遵循两个原则:
类与类之间互斥,不存在既是黑又是白的东西;
每个对象都必须要有类别,就像每个动物都有自己的界门纲目科属种

2.定序变量 Ordinal Variable
这个也好理解,一般是指有具体数据表示的变量,属于同一类,可以按照数据大小进行排序,但这仅仅可以反映数据之间的次序,可以理解为每一个数据变量的大小编号,也即仅仅是排列次序,无法表示出大于或小于的数量或距离,就是具体的,1号比2号大或者小多少。

3.定距变量 Interval Variable
有了前面两个做基础,这个就比较好理解了。就是区别同一类别下每个变量的等级次序及其距离,具有加减的数学特质,但只能用加减而不能用乘除说明数据之间的关系。定距变量没有真正的零点

4.定比变量 Ratio Variable
定比变量存在真正的零点,可以做乘除的运算。比如,某人的工资是0元,那就是没有工资,但对于温度,说温度是0度的时候,并不能说就没有温度。这里有个更好理解的例子:就智商而言,即使A是140分而B是70分,我们也不能说前者的智力是后者的两倍,只能说两者相差70分。因为0值是不固定的,如果将其向上移高20分,则A的智商变为120分而B变成50分,两者的相差仍是70分,但A却是B的2.4倍,而不是原先的两倍了。摄氏温度这一变量也如此。

时间序列数据分类:

  1. 时期序列 序列中的观测值反映现象在一段时期内发展过程的总量,不同时期的观测值可以相加,相加结果表示在更长一段时间内的活动总量。如,累积降雨量是可以将降雨量观测值相加,且降雨量在气象观测规范中归为需要累加的观测量,可参照国标。
  2. 时点序列 序列中的观测值反映现象在某一瞬间上达到的水平,不同时期的观测值不能相加,相加结果没有实际意义。如,径流量就是水文站一天内不同时间段内的观测值,一般全国水雨情网站上全国水雨情网站一天记录1-3次径流量,这些观测数据相加没有意义,可参照平均值。

参考链接
定类,定序,定距,定比四种数据类型

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值