算法k近邻和朴素贝叶斯

K近邻算法

通过“邻居”判断所述的类别
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
如何求距离呢:
在这里插入图片描述
为了防止某一个特征的数据数量太大,我们需要做标准化处理
在这里插入图片描述
K的取值:会影响最后的结果。
案例:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
pandas处理时间戳
在这里插入图片描述
增加时间戳
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
P(科技|影院,支付宝,云计算) = P(影院,支付宝,云计算|科技)*P(科技)
= (8/100)(20/100)(63/100)(30/90) = 0.00456
P(娱乐|影院,支付宝,云计算) = P(影院,支付宝,云计算|娱乐)*P(娱乐)
= (56/121)(15/100)(0/121)(60/90) = 0
在这里插入图片描述
在这里插入图片描述

分类模型评估

混淆矩阵
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分类模型评估API
sklearn.metrics.classification_report
在这里插入图片描述
在这里插入图片描述

交叉验证和网格搜索对K近邻算法调优

交叉验证:为了让被评估的模型更加准信可信
把所有数据分成N等分。让其中一个当成验证集,其他的都是数据集
在这里插入图片描述
所有的数据都做过训练集,也做过测试集,求均值。这样得到的结果更加准确。
当K=1.5.7.10不同的值,每次取值都进行一次交叉验证。
在这里插入图片描述

网格搜索:调参数 K-近邻:超参数K
在这里插入图片描述
和调节音响一样,总有一个点,使得结果最好
在这里插入图片描述
最长用的是十折交叉验证
如果一个算法中有2个超参数,就进行两两组合。
比如a[2,3,5,8,10],b[20,70,80],两两组合,就有15种组合方式
超参数搜索-网格搜索api:
在这里插入图片描述
这个api代表了网格搜索和交叉验证一起使用

在这里插入图片描述
只要把它放到GridSearchCV,就不用fit,score了
在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值