读《scikiit-learn机器学习》黄永昌第四章

                                       第4章_k-近邻算法

请用一句话描述k-近邻算法的原理

未标记样本的类别,由距离其最近的k个邻居投票来决定

k-近邻算法有那些变种

1:增加邻居的权重,越紧权重越高 2:使用一定半径内的点取代最近的k个点,主要数据采集样本不均匀时,效果较好

使用不同的算法参数k,观察针对同一个数据,拟合曲线有什么变化

k偏小容易过拟合

使用selectKBest选择出4个相关性最高的特征,并吧这4个特征作为输入来训练模型,看模型准确性是否有提高?为什么

没有,反而降低,因为2个是最好的,图形更容易分析

本章实例:使用k-近邻算法进行分类

                  使用k-近邻算法进行回归拟合

                  糖尿病预测

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值