概念
特征预处理是什么呢?特征预处理是通过统计方法(数学方法)将数据转换成算法要求的数据,所以特征预处理也叫做数据预处理。
下面是几种数据预处理的方法
1、数值型数据:标准缩放:1、归一化2、标准化
2、类别型数据:one-hot编码
3、时间类别:时间的划分
下面介绍归一化和标准化归一化
归一化
特点:通过对原始数据进行变换把数据映射到(默认在[0,1])之间公式:
其中公式作用于每一列(列:特征,行:样本),max和min分别代表每一列的最大值和最小值,X''为最终结果,mx,mi分别为指定的映射区间的最大值和最小值默认值为1和0。
下面是归一化的例子: