问题一:归一化的作用?
归一化之后可以减少极大极小边缘值对数据的影响,将原数据转换为符合正态分布的数据,加快了梯度下降求最优解的速度,提高准确度
问题二:StandardScaler类中transform和fit_transform方法有什么区别?
fit:用于计算训练数据的均值和方差, 后面就会用均值和方差来转换训练数据
transform:它只是进行转换,只是把训练数据转换成标准的正态分布
fit_transform:不仅计算训练数据的均值和方差,还会基于计算出来的均值和方差来转换训练数据,从而把数据转换成标准的正太分布
问题三:为何测试集使用fit_transform验证集使用transform
在测试集时已经收集了数据的均值和方差并且我们认为测试集和验证集数据收集的都足够充分,均值和方差一致,所以验证集不需要重新求均值和方差
PS:transform中需要二维的参数,x_train是三维数据所以要先转化成二维数据,处理结束再转化为三维数据
参考连接:https://blog.csdn.net/u011734144/article/details/84066784