《机器学习实战》学习过程
本专栏是记录我在学习《机器学习实战》一书中的一些知识点,主要是在书中遇到的一些问题记录。
清风不识字12138
清风不识字,何故乱翻书!
展开
-
《机器学习实战》总结
用了大概一个月的时间,终于把《机器学习实战》这本书看了一遍,书中的代码也全部敲了一遍。下来就总结下书中提到的各个算法。 (注意,本博客适用于复习,不适用新手) 一、监督学习 我的理解就是给的数据是有结果的,根据这些已经明确结果的数据去推测那些没有明确结果的数据的结果。 监督学习可简单分为分类和回归: 分类常用于处理标称型数据(数据结果为0,1或者结原创 2017-09-25 11:38:24 · 622 阅读 · 1 评论 -
《机器学习实战》第十五章 MapReduce
在学习这一章中又遇到了python2 和python3的不同之处导致的错误。 具体修改如下: print 在python2中是语句,在python3中是函数;print >> 这个用法在python2.x版本是可以的,但在3中不行。 2.X: print "The answer is", 2*2 3.X: print("The answer is", 2*2) 2原创 2017-09-22 13:17:29 · 771 阅读 · 0 评论 -
《机器学习实战》第十三章 PCA
在这一章的学习过程中,前面的程序都可以正常执行,但是在做13.3节,利用PCA对半导体制造数据降维时提示错误:numpy.linalg.linalg.LinAlgError: Array must not contain infs or NaNs错误写的很明显,数据中含有了无穷大(infs)或缺失值(NaNs),那么我们找到提示出错的语句eigVals, eigVects = np.linalg.e原创 2017-09-21 14:20:44 · 5272 阅读 · 1 评论 -
机器学习第十二章
本章,主要是讲了通过FP树的方法来寻找频繁项集,请注意,这种方法不能用于发现关联规则。FP树的构建过程可以直接看书中的图12-3和表12-2,图12-3很好地说明了FP树的构建过程。 由于我使用的是python3,所以需要对书中的代码进行一些小修改。 提示错误:RuntimeError: dictionary changed size during iteration对应函数createTree原创 2017-09-20 14:12:28 · 489 阅读 · 0 评论 -
《机器学习实战》第十章错误总结
这一章完成后发现自己的基础还不牢固,先来复习下基础 ( )———元组tuples [ ]———列表list { }———字典dict 尤其是列表list,一定要看清有多少个[ ]下边的错误就是由于基础不牢导致的return np.matrix(centList), clusterAssment提示错误ValueError: matrix must be 2-dimensional 或者Ty原创 2017-09-18 17:13:41 · 3783 阅读 · 0 评论 -
python自带的sum()函数和numpy库中的sum()函数的区别
在学习《机器学习实战》一书的第十章时,对return np.sqrt(sum(np.power(vecA - vecB, 2)))这样一条语句输出的结果老是不对,明明想要输出的是对两个列向量的差的平方求和后再开方,输出的应该是一个float型数值,但是这条语句执行后输出的却是一个包含两个值的行向量matrix([[ 5.112672, 0.860815]])而且我将这两个值分别平方后再相加,再开方原创 2017-09-18 10:53:52 · 5748 阅读 · 0 评论 -
《机器学习实战》第九章
在学习《Machine Learning in Active》的第九章时,由于自己使用的是python3所以在测试代码时出现了不少错误,下面就做一下整合,并给出解决方法1.NameError: name 'errType' is not defined最开始提示NameError: name 'errType' is not defined错误,所以我就把函数createTree()和ch原创 2017-09-14 14:57:15 · 1516 阅读 · 1 评论 -
《机器学习实战》朴素贝叶斯
机器学习实战的朴素贝叶斯一章中的源文件老是提示IndexError: range object index out of range看源码里怎么都不会溢出啊,除非minLen为0;所以看了下测试集中的两个链接,第一个链接打开后是正常的,第二个打不开了,所以问题就出在这里了,minLen确实等于0了,怎么修改呢?只好把挂掉的链接换一个新的,我换的是参考资料:http://www.cnbl原创 2017-09-08 14:38:11 · 664 阅读 · 0 评论 -
python 提示错误AttributeError: type object 'str' has no attribute '_name_'
在做《Machine Learning in Action》书中的第三章绘制树形图时遇到了这个问题AttributeError: type object 'str' has no attribute '_name_'很明显是if type(secondDict[key])._name_ == ‘dict’:这一句有问题,在python3中并没有type(secondDict[key])._n原创 2017-09-07 10:29:32 · 57432 阅读 · 1 评论 -
python提示错误TypeError: 'dict_keys' object does not support indexing
python提示错误TypeError: 'dict_keys' object does not support indexing原因:python2与python3之间的差异python2中形如myTree.keys()[0]这样的写法是没有问题的,因为myTree.keys()返回的是一个list;而在python3中myTree.key()返回的则是dick_keys类型,故而出原创 2017-09-07 09:49:01 · 11572 阅读 · 0 评论 -
在使用python语言的open函数时,提示错误OSError: [Errno 22] Invalid argument: ‘文件路径’
如题,在使用python语言的open函数时,提示错误OSError: [Errno 22] Invalid argument: ‘文件路径’,在查阅了大量资料后也得到了一些解决方案,但是这些解决方案对于作者的情况都不适用,依然报错,没办法,虽然作者的英语水平很不咋地,但中文帮不了作者,只好求助于英文了。 建议各位看客在修改时,仔细看清楚自己的情况是否适用。废话不多说,开始正文。原创 2017-09-06 09:20:44 · 76372 阅读 · 12 评论