步步学习之用python实战机器学习1-kNN (K-NearestNeighbors)算法(a)

本文以初学者的角度,通过《机器学习实战》一书中的例子,介绍了机器学习的基础算法——kNN(K-NearestNeighbors)。kNN是一种分类方法,通过计算样本间的距离,选取最近的k个邻居来决定未知样本的类别。文章详细解释了kNN的工作原理,并通过一个电影分类的例子说明了k值的重要性。最后,文章将实现一个简单的kNN算法代码示例。
摘要由CSDN通过智能技术生成

我最近才开始接触机器学习,我大学数学学的几乎忘了,最近才接触python。所以我以一个完全初学者角度来学习机器学习。

我主要用的书籍就是machine learning in action (机器学习实战)这本书。我主要是用文中已有的代码来讲解机器学习。

同时对代码进行大量注释,主要针对初学者以及python刚学的,这样理解透彻。

第一章  K近邻算法kNN(K-NearestNeighbors)

 这个算法是最基础的机器学习分类方法。我先给定义。

如果一个样本在特征空间中k个最相似的样本中的大多数属于一类,则这个样本属于这个类别。

书中举出了一个例子。也就是电影的例子。

比如怎么把自己看过的电影进行分类,怎么定义它。

比如把电影分成 爱情片还是动作片。比如有些人通过接吻和武打的次数来来进行分类。图中给出了一些电影的分类按照接吻的次数和武打的次数。



但是现在有一部电影你想知道是爱情片还是动作片。

首先根据以前的数据,比如下表中的电影类别来判别未知电影的类别。


首先我们计算未知电影与已知电影的距离。



然后我们假设k=3。那么我们对已经算好的上个表格中距离数据排序。找出距离最近的前三位电影。然后我们发现He’sNot Really into Dudes, Beautiful Woman, and Cali

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值