4.5《算法图解》笔记——Chapter 10 KNN

算法图解笔记——Chapter 10 KNN
Author: Seven Zou
Email: zoushiqi0404@gmail.com
Language: Python2.7


5 K最近邻算法

K最近邻算法属于机器学习算法中的一种算法,也是我在课上选用来完成实践小组作业的算法。借助本章节,可以进行复习巩固。我个人类比KNN借用中国的一句谚语来总结就是“近朱者赤近墨者黑”,通过个体来确定周围Neighbor。针对数据,需要学习特征抽取;学习回归(预测数值);学习K最近邻算法的应用案例和局限性。


5.1 Case——推荐系统

假设需要为用户创建一个电影推荐系统。那么可以将所有用户放入一个图表中。
在这里插入图片描述
图中这些用户在图表中的位置取决于其喜好,所以喜好相似度高的用户,其距离越近。假设你要向Priyanka推荐电影,可以找出五位与他最接近的用户。
在这里插入图片描述
假设在对电影的喜好方面,Justin、JC、Joey、Lance和Chris都与Priyanka相似,那么他们喜欢的电影Priyanka可能也喜欢。那么问题就转化了,只要他们中任何一人喜欢的电影,就将其推荐给Priyanka。

5.1.1 特征抽取

特征,按照我的理解就是不同数据的独有属性。比如水果,你可以选取它的个体和颜色特征进行比较。那么我们需要对数据进行特征抽取,然后再根据这些特征绘图。在图中,各个特征的数据变成了离散的点,而在度量两个特征(点)的距离。可以运用如下公式,其中 ∥ ⋅ ∥ \left\| \cdot \right\| 表示为 2 − n o r m 2-norm 2norm
∥ ( x 1 − x 2 ) + ( y 1 + y 2 ) ∥ \left\|(x_1 - x_2)+(y_1 +y_2)\right\| (x1

这是一本零基础就能读懂的算法书籍,读者不需要因为自己没有语言基础而畏惧。书籍的第2章便是一个C语言的入门教程,内容非常易懂,并且十分实用,阅读完这章就可以对本书需要的C语言基础有一个较好的掌握。本书已经覆盖了大部分基础经典算法,不仅可以作为考研机试和PAT的学习教材,对其他的一些算法考试(例如CCF的CSP考试)或者考研初试的数据结构科目的学习和理解也很有帮助,甚至仅仅想学习经典算法的读者也能从本书中学到许多知识,本书还有配套的《算法笔记上机训练实战指南》本书的作者是同样经历过考研机试和各类算法考试的专家型学长,知晓这类考试中的痛点,以及考生在学习算法时容易产生困惑的地方,因此可以把本书看作是学长为你奉献的满满的经验干货,这是最有价值的东西。本书的最个试印版本献给了浙大考研学子,并令当年的浙大考研机试平均分增加了十多分,收获了考生的大量好评。但作者并没有止步于此,经过了半年多时间的内容完善和补充之后,新的版本在新一年的考研机试中再次获得了考生的一致赞美。最后,在经过精心整理之后,书籍终于定稿,并编撰成书。我们知道,纸质书籍的一个弱点就在于不能像软件一样随时更新内容,但本书采用了与二维码相结合的方式,使得本书变为能够随时更新内容的书籍,读者也可以随时从二 维码中找到勘误。这种作者和读者能够相互沟通的方式让书籍变“活”了,也能够帮助提升读者对知识的理解。 本书内容包括:C/C++快速入门、入门模拟、算法初步、数学问题、C++标准模板库(STL)、数据结构专题(两章)、搜索专题、图算法专题、动态规划专题、字符串专题、专题扩展。书中每小节的末尾均印有二维码,用以实时更新或补充书籍的内容及发布本书的勘误。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值