先了解什么是z-score
**Z值(z-score)**又称标准数,能够将不同量级的数据转化为相同量级,实现标准化。
其公式表示为:
μσ
其中:x为实际测量值,μ为平均数,σ为标准差。
Z-score后的值本身没有实际意义,仅使数据标准统一化。实测值>平均值,则z为正值,实测值<平均值,则z为负值。
在R中实现计算z-score
R语言中默认利用函数scale
实现 z-score 的变换,scale
函数共有两个参数center
和scale
,并且两个参数均默认为TURE。其中center = T
表示数据中心化,scale = T
为真表示数据标准化。
z-score前后数据变化
x <- matrix(runif(100, 5.0, 7.5),nrow = 20)
b <- scale(x)
par(mfrow = c(2,2))
plot(x)
plot(b)
boxplot(x)
boxplot(b)