Part1-Chapter2-k-近邻算法

工作原理:
我们有一批已知其分类的训练样本集,当输入测试样本时,我们通过计算某一测试样本与所有训练样本的距离,最终确定k个离该测试样本最近的训练样本点。这k个点里出现最多的类,就作为该测试样本的类。

书中给了三个例子,一个是理论上的k-近邻算法实现;一个是利用约会网站数据计算匹配度;一个是识别手写数字。

因为我还并不熟悉numpy的函数,所以这章是先看懂书上的代码,然后凭记忆将其复现。代码都不算难,主要收获是认识了挺多函数。

以下为收获的函数:
tile():非常形象。函数的形参是两个,一个普通变量和一个数组变量。函数的作用即是用前者作为肉,填充后者的骨。
x**n:表示x的n次方
argsort():顺序排列数组中数据,并将其对应的索引值存储为一个数组。
get(key,default=null):得到key对应的值,否则给出default值。
sorted():对字典进行排序。
iteritems():将一个字典以列表的形式返回。
itemgetter(x):获得对象x位置的值。
strip():去除某符号,无形参则去除回车。
split(x):将数据用x分开。
raw_input():将输入数据作字符串处理。
listdir():返回指定文件夹包含的文件或文件夹名。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值