Machine Learning in Action 学习笔记-(2)kNN k近邻算法

转载 2016年06月01日 11:05:26

kNN是最常见的聚类算法,通过比较待测被试特征与训练样本之间的欧式距离,选取k个最近的点,然后找出出现概率最高的label作为我们的预测结果。

其中k的值,随机选择训练样本的方案,训练样本数目的变化都将会影响到我们最终的聚类准确率。

这种基于实例的算法将会使我们无法知道平均实例样本,也将会影响到我们对于典型实例样本特征的理解。

最大的收获是学会了更多的Python命令(在numPy)下的

.argsort() 返回数组中从小到大排列的索引

reload() 重新载入module

line.strip() 去掉所有的回车字符

tile为numPy函数,可以将前面的数组以相同元素扩充成和后面数组相同的维度

dataset.min(0)返回dataset中第一小的值

dataset.max(0)返回dataset中第一大的值

strline.append(A)将A添加到strline的最后作为新元素加入


在面试题中,也会有比如伐木场地址选择等问题,这时候就需要立刻能想到,用kNN算法可能是很好的解决方案


如果想要方便调试程序,可以在spyder的File explorer中选择我们程序所在的文件夹(比如说kNN.py)所在的文件夹然后右击-open Ipython here,这样就可以在这个目录下建立一个Ipython进程了

读《Machine Learning in Action》的感想

今天刚刚读完了一本叫《Machine Learning in Action》的书,历时还是挺长的,中途因为课程紧张,停顿了几个月的时间。总体感觉还不错,让我开了眼界。 不过这不是一本入门的书,主要讲...

Machine Learning In Action -- kNN的python实现

从今天开始同时学习Machine Learning

Machine Learning in Action/机器学习实践:kNN算法之约会问题

因为自己比较忙,就没有太多时间去学习python的基础知识,所以简单的看了一点py的语法,就直接上书开始敲代码了,中间遇到比较多的问题,所以就加了很多注释(用的python3)from numpy i...
  • Karo_cs
  • Karo_cs
  • 2017年11月16日 16:20
  • 38

<Machine Learning in Action >之一 k-近邻算法 C#实现手写识别

def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.shape[0] diffMat = tile(inX, (...

Machine Learning in Action 学习笔记-(4)基于概率论的分类方法:朴素贝叶斯

开篇为我们讲解了许多实际应用情况下,我们可能不需要得到精准的分类,而是属于某一类的概率,以及属于其他类的概率。 这里我就简单的以论坛侮辱性言语检测为例,来讲一下算法的流程。 函数伪代码是: 计算每个类...

Machine Learning In Action - Chapter 2 KNN

Chapter 2 - KNN KNN伪代码 For every point in our dataset: calculate the distance between inX and th...

Machine Learning in Action_CH2_2_使用kNN改进约会网站的配对效果

from numpy import * import operator # 创建数据 def createDataBase(): group = array([[1.0, 1.1], [1....

Machine Learning K近邻算法

  • 2014年12月23日 12:47
  • 338KB
  • 下载

Machine Learning in action –kNN(已勘误)

Machine Learning in action –kNN最近在自学机器学习,应导师要求,先把《Machine Learning with R》动手刷了一遍,感觉R真不能算是一门计算机语言,感觉...

Machine Learning In Action -- ID3决策树学习算法的python实现

decision tree Learning 决策树学习笔记 决策树学习是一种相对比较简单的分类学习方法,但是分类效果较好并且表示直观,主要针对离散型目标,它也等价于用if-then规则表示。 ...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Machine Learning in Action 学习笔记-(2)kNN k近邻算法
举报原因:
原因补充:

(最多只允许输入30个字)