机器学习-------算法(四)

本文介绍了K近邻算法,重点在于如何计算距离,特别是欧氏距离。讨论了相似样本的定义,并提示在实际应用中可能需要对数据进行标准化处理。此外,详细说明了sklearn库中的KNeighborsClassifier API,包括算法选项如'ball_tree'、'kd_tree'和'brute',以及k值选择对算法性能的影响。
摘要由CSDN通过智能技术生成

分类算法----K近邻算法:

算法描述:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。

(一)最重要的一点就是求距离

距离公式----欧氏距离

√(𝑎1−𝑏1)^2+(𝑎2−𝑏2)^2+(𝑎3−𝑏3)^2

上述公式就是求了两者之间的距离。

相似的样本,特征值之间的值应该是相似的。

附加:

K-近邻算法:为防止某一项对结果的影响,需要做标准化处理。

(二)API:

API: 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值