虽然理解对数据的标准化归一化的好处,但是今天突然想到一个小白的问题,那就是:这样处理后对最终的参数w没有影响吗?有影响的话,那模型还有效吗?
经过一番思考与讨论,发现还是之前的理解不够深入,才会有这样的问题。
首先,要明确的一点是我们最终需要的是什么? - 是通过对训练集的数据找规律,即可以应用到未来的数据的规律,从而做出预测。所以,核心是规律,我们可以对原始数据做无数种处理,那么我们也可以找到无数种对应的规律,应用到对应的预测数据集,来生成预测结果。所以只要我们在预测的时候,对预测数据做跟训练集数据一样的处理,从而消除这个干扰动作,那么就可以做出合理的预测。
另外,当我们对X进行处理的时候,对Y的处理不是必须的。只是如果对Y做相应的处理后,拟合效果会更好。同理,对X的处理也不是必须的,只是在一些情况下处理后可以更快更精确的得到模型。