第4章_k-近邻算法
请用一句话描述k-近邻算法的原理
未标记样本的类别,由距离其最近的k个邻居投票来决定
k-近邻算法有那些变种
1:增加邻居的权重,越紧权重越高 2:使用一定半径内的点取代最近的k个点,主要数据采集样本不均匀时,效果较好
使用不同的算法参数k,观察针对同一个数据,拟合曲线有什么变化
k偏小容易过拟合
使用selectKBest选择出4个相关性最高的特征,并吧这4个特征作为输入来训练模型,看模型准确性是否有提高?为什么
没有,反而降低,因为2个是最好的,图形更容易分析
本章实例:使用k-近邻算法进行分类
使用k-近邻算法进行回归拟合
糖尿病预测