【数据收集】名义变量、序级变量、区间变量、比率变量的理解及例子
测量变量(measurement variable)是用来描述一个特定的实体的未知属性的,可以被分为以下四类:名义变量、序级变量、区间变量和比率变量。 其中名义变量和序级变量描绘数据的定性属性(qualitative attributes),区间变量和比率变量描绘数据的定量属性(quantitative attributes)。
名义变量(Nominal Variable)
名义变量是一种用于对被度量的特定属性进行命名、标签或分类的变量。它采用代表不同类别的定性值,这些类别没有内在的排序。
不能对名义变量进行数值运算
Operations: =、!=
分类及举例
可以在两个层面上对名义变量进行分类:1.数据收集的方法 2.数值属性
- 从数据收集方法
开放性问题 open-ended technique
e.g. 开放性问答:你认为怎样提升我们的服务质量?
闭合性问题 closed-ended technique
e.g. 多选题问卷调查:你认为以下方法怎么做可以提升我们的服务质量?A. 重新装修店面 B.推出新菜品 C.培训员工 - 数值属性
数值型的变量(Numeric Variable)
e.g. 电话号码、身份证号
非数值型变量(Non numeric Variable)
e.g.名字、性别、地址
序级变量(Ordinal Variable)
序级变量是一种把数值按顺序排列的测量变量。在序级变量中,没有标准的排序,有中值和众数。
Operations:=、!=、>、<、>=、<=
分类和举例
没有标准的分类方法,但通常和名义变量一样将其分为数值型变量和非数值型变量。
e.g.成绩(A、A+、B)、用户满意度(10、9、8)
区间变量(Interval Variable)
区间变量定义沿尺度测量的值,每两个点之间距离相等,为连续变量。
没有0值。
Operations:=、!=、>、<、>=、<=、+、-
分类和举例
e.g. 温度(华氏度/摄氏度)、时间(12-hour clock)
分类:
- 正态分布/高斯分布
- 非正态分布
比率变量
连续变量,与区间变量唯一的区别就是比率变量拥有一个绝对的零值。
Operations:=、!=、>、<、>=、<=、+、-、:
分类和举例
e.g. Kelvin温度、身高、体重
温度(摄氏度/华氏度)不是比率变量因为只能说今天温度比昨天温度高/低多少度,不会说今天温度是昨天温度的几倍。温度计上的0摄氏度是规定的相对零点。
MCQ:今年妈妈年龄是小明年龄的2倍,小明今年20岁,妈妈10年后多少岁?
A 30 B 40 C 50
调查问卷:你每天看手机时间有多久?
A少于两小时 B2-5小时 C5小时以上
分类方法同区间变量一样
Reference
[第一次写blog,有任何不准确的地方,请多多指教,谢谢;)]