Part1-Chapter2-k-近邻算法

JachinMa

于 2019-03-23 23:21:52 发布

阅读量197

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JachinMa/article/details/88770841

版权

工作原理：
我们有一批已知其分类的训练样本集，当输入测试样本时，我们通过计算某一测试样本与所有训练样本的距离，最终确定k个离该测试样本最近的训练样本点。这k个点里出现最多的类，就作为该测试样本的类。

书中给了三个例子，一个是理论上的k-近邻算法实现；一个是利用约会网站数据计算匹配度；一个是识别手写数字。

因为我还并不熟悉numpy的函数，所以这章是先看懂书上的代码，然后凭记忆将其复现。代码都不算难，主要收获是认识了挺多函数。

以下为收获的函数：
tile()：非常形象。函数的形参是两个，一个普通变量和一个数组变量。函数的作用即是用前者作为肉，填充后者的骨。
x**n：表示x的n次方
argsort()：顺序排列数组中数据，并将其对应的索引值存储为一个数组。
get(key,default=null)：得到key对应的值，否则给出default值。
sorted()：对字典进行排序。
iteritems()：将一个字典以列表的形式返回。
itemgetter(x)：获得对象x位置的值。
strip()：去除某符号，无形参则去除回车。
split(x)：将数据用x分开。
raw_input()：将输入数据作字符串处理。
listdir()：返回指定文件夹包含的文件或文件夹名。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。