python机器学习---监督学习---K最近邻算法(用于分类和回归)

本文介绍了K最近邻(KNN)算法的基本原理,包括分类和回归的应用。通过实例展示了如何利用KNN进行电影分类,以及酒类的预测。同时,讨论了KNN算法的优缺点,指出其在大规模数据集、高维数据和稀疏数据上的挑战。
摘要由CSDN通过智能技术生成

目录

1. K最近邻算法原理

2. K最近邻算法项目实战

2.1 电影分类

2.2 酒分类

3. K最近邻算法优缺点


备注:本文主要来自于对《深入浅出python机器学习》书籍的学习总结笔记,感兴趣的同学可以购买本书学习,学习的本质就是形成自己的逻辑。

1. K最近邻算法原理

基本思想:一个样本在特征空间中,总会有k个最临近的样本。

如在左边的图中,最近邻数k=1,即找到与问号样本最近的一个点,该点是灰色,因此将问号样本分类为灰色;

在右边的图中,最近邻数k=3,即找到与问号样本最近的3个点,发现有1个是灰色,2个是黑色,因此将问号样本分类为黑色。

这里举的是分类案例,实际上K最近邻算法也可用于回归,原理和用于分类相同。预测一个问号样本的的y值,模型会找到距离该问号样本最近的k个训练数据集中的点,并且将它们y值取平均值作为该问号样本的预测值。


2. K最近邻算法项目实战

2.1 电影分类</

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值