数据中心化是指数据集中的各项数据减去数据集的均值。
> x <- c(2,3,4,4,4,5,34)
> mean(x)
[1] 8
> x-mean(x)
[1] -6 -5 -4 -4 -4 -3 26
数据标准化是指在中心化之后再除以数据集的标准差。
>
> sd(x)
[1] 11.50362
> (x-mean(x))/sd(x)
[1] -0.5215748 -0.4346457 -0.3477166 -0.3477166 -0.3477166 -0.2607874 2.2601576
> ?scale
> scale(state.x77,center = T,scale = T)