机器学习实战
清风不识字12138
清风不识字,何故乱翻书!
展开
-
《机器学习实战》总结
用了大概一个月的时间,终于把《机器学习实战》这本书看了一遍,书中的代码也全部敲了一遍。下来就总结下书中提到的各个算法。 (注意,本博客适用于复习,不适用新手) 一、监督学习 我的理解就是给的数据是有结果的,根据这些已经明确结果的数据去推测那些没有明确结果的数据的结果。 监督学习可简单分为分类和回归: 分类常用于处理标称型数据(数据结果为0,1或者结原创 2017-09-25 11:38:24 · 627 阅读 · 1 评论 -
python自带的sum()函数和numpy库中的sum()函数的区别
在学习《机器学习实战》一书的第十章时,对return np.sqrt(sum(np.power(vecA - vecB, 2)))这样一条语句输出的结果老是不对,明明想要输出的是对两个列向量的差的平方求和后再开方,输出的应该是一个float型数值,但是这条语句执行后输出的却是一个包含两个值的行向量matrix([[ 5.112672, 0.860815]])而且我将这两个值分别平方后再相加,再开方原创 2017-09-18 10:53:52 · 5781 阅读 · 0 评论 -
机器学习第十二章
本章,主要是讲了通过FP树的方法来寻找频繁项集,请注意,这种方法不能用于发现关联规则。FP树的构建过程可以直接看书中的图12-3和表12-2,图12-3很好地说明了FP树的构建过程。 由于我使用的是python3,所以需要对书中的代码进行一些小修改。 提示错误:RuntimeError: dictionary changed size during iteration对应函数createTree原创 2017-09-20 14:12:28 · 497 阅读 · 0 评论 -
《机器学习实战》第十三章 PCA
在这一章的学习过程中,前面的程序都可以正常执行,但是在做13.3节,利用PCA对半导体制造数据降维时提示错误:numpy.linalg.linalg.LinAlgError: Array must not contain infs or NaNs错误写的很明显,数据中含有了无穷大(infs)或缺失值(NaNs),那么我们找到提示出错的语句eigVals, eigVects = np.linalg.e原创 2017-09-21 14:20:44 · 5300 阅读 · 1 评论 -
《机器学习实战》第十五章 MapReduce
在学习这一章中又遇到了python2 和python3的不同之处导致的错误。 具体修改如下: print 在python2中是语句,在python3中是函数;print >> 这个用法在python2.x版本是可以的,但在3中不行。 2.X: print "The answer is", 2*2 3.X: print("The answer is", 2*2) 2原创 2017-09-22 13:17:29 · 778 阅读 · 0 评论 -
《机器学习实战》第十章错误总结
这一章完成后发现自己的基础还不牢固,先来复习下基础 ( )———元组tuples [ ]———列表list { }———字典dict 尤其是列表list,一定要看清有多少个[ ]下边的错误就是由于基础不牢导致的return np.matrix(centList), clusterAssment提示错误ValueError: matrix must be 2-dimensional 或者Ty原创 2017-09-18 17:13:41 · 3807 阅读 · 0 评论