什么是噪音?其实噪音就是难以轻易被区分并对输出结果产生干扰的那些数据,他们是与众不同的。噪音样本在自然界中是普遍存在的,他被自然的包裹在大量数据集中,正常的数据集很自然的会存在噪音。但噪音其实是我们不希望存在的成分,因为他的出现往往会影响模型的准确性,逼迫我们不得不付出更大的努力,生成更加复杂的模型来把噪音包容进去,比如决策树的剪枝操作就是需要加入修正参数α。