在进行回归分析或机器学习时,由于数据普遍存在量纲差异,因此在建模之前往往需要对数据进行标准化或规范化的处理,以消除数据间的量纲影响。本文主要介绍min-max规范化、
使用R自带的mtcars数据集进行演示,选择其中的mpg,disp,hp,drat,wt, qsec等6个变量组成一个新的数据集。并且使用BruceR[1]包进行变量的描述性统计,查看变量在均值、标准差、范围等方面所发生的变化。关于如何用BruceR输出变量描述性统计结果可参考BruceR|输出描述性统计到word三线表。
nstall.packages("bruceR") #安装计算变量的均值、标准差的bruceR包
data <- mtcars[c("mpg",