在模式识别、人工神经网络方法中,为什么要进行数据预处理呢?
1.原数据可能数据量很大,维数很,计算机处理起来时间复杂度很高,预处理可以降低数据维度。2.数据的很多特性非常影响神经网络等分类模型的效果。
比如数据值得分布不在一个尺度上,当地气温值与当地月工资显然不在一个数量级上,这时,需要数据规范化,把这两个特征的数据都规范到0到1,这样使得它们对模型的影响具有同样的尺度。
3.当然,数据预处理还有很多,比如中心化,去噪,降维,平滑,变换等等,各有各的目的,总之都是为了最终分类器的效果服务,由于原数据可能含有大量的噪声,去除噪声是有必要的。
谷歌人工智能写作项目:神经网络伪原创
在模式识别,人工神经网络方法中,为什么要进行数据预处理
文案狗。
可以降低数据大小,通过归约,可以建立好的样本集,因为脏数据的存在,需要预处理单位不一致,比如,身高1.7米,体重120斤,那么1.7和120不在一个数量级上,导致1.7的权重被淹没有时候需要降维,降低运算量,有时需要升维,达到线性可分,这些都是预处理的方面。