简述K近邻算法的优缺点 优点 1、简单,易于理解,易于实现。 2、只需保存训练样本和标记,无需估计参数,无需训练。 3、不易受小错误概率的影响。经理论证明,最近邻的渐进错误率最坏时不超过两倍的贝叶斯错误率,最好时接近或达到贝叶斯错误率。 缺点 1、K的选择不固定。 2、预测结果容易受含噪声数据的影响。 3、当样本不平衡时,新样本的类别偏向训练样本中数量占优的类别,容易导致预测错误。 4、具有较高的计算复杂度和内存消耗,因为对每一个待分类的文本,都要计算它到全体已知样本的距离,才能求得它的K个最近邻。