自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

转载 《推荐系统实践》附上Reference 中的干货 (Paper,Blog等资料的链接)

《推荐系统实践》这只是一本197页的书,但作者附上了诸多好资料,无论是paper, blog文章,wikipedia词条,数据集还是开源项目等      附上资料链接,格式基本按照‘URL+资料名称+出现在书中的页数’,某些链接可能需要你翻过一道‘墙’,某些重复引用的没重复贴上链接了         http://en.wikipedia.org/wiki/Information

2017-09-27 14:37:21 2822

原创 推荐系统实践-第一章

1.什么是推荐系统? ——对用户的行为信息进行分析,预测数据库中用户可能感兴趣的信息。 2.推荐系统的主要任务是什么? ——解决信息过载的问题 3.如何评鉴一个推荐系统的好坏? ——三种方式相结合:离线实验、用户调查和在线实验 ——评测指标:用户满意度、预测准确度(评分预测和TopN推荐)、覆盖率、多样性、新颖性、惊喜度、信任度、实时性、健

2017-09-27 13:48:18 265

原创 《机器学习实战》总结

用了大概一个月的时间,终于把《机器学习实战》这本书看了一遍,书中的代码也全部敲了一遍。下来就总结下书中提到的各个算法。 (注意,本博客适用于复习,不适用新手) 一、监督学习 我的理解就是给的数据是有结果的,根据这些已经明确结果的数据去推测那些没有明确结果的数据的结果。 监督学习可简单分为分类和回归: 分类常用于处理标称型数据(数据结果为0,1或者结

2017-09-25 11:38:24 608 1

原创 《机器学习实战》第十五章 MapReduce

在学习这一章中又遇到了python2 和python3的不同之处导致的错误。 具体修改如下: print 在python2中是语句,在python3中是函数;print >> 这个用法在python2.x版本是可以的,但在3中不行。 2.X: print "The answer is", 2*2 3.X: print("The answer is", 2*2) 2

2017-09-22 13:17:29 728

原创 《机器学习实战》第十三章 PCA

在这一章的学习过程中,前面的程序都可以正常执行,但是在做13.3节,利用PCA对半导体制造数据降维时提示错误:numpy.linalg.linalg.LinAlgError: Array must not contain infs or NaNs错误写的很明显,数据中含有了无穷大(infs)或缺失值(NaNs),那么我们找到提示出错的语句eigVals, eigVects = np.linalg.e

2017-09-21 14:20:44 5172 1

原创 机器学习第十二章

本章,主要是讲了通过FP树的方法来寻找频繁项集,请注意,这种方法不能用于发现关联规则。FP树的构建过程可以直接看书中的图12-3和表12-2,图12-3很好地说明了FP树的构建过程。 由于我使用的是python3,所以需要对书中的代码进行一些小修改。 提示错误:RuntimeError: dictionary changed size during iteration对应函数createTree

2017-09-20 14:12:28 448

原创 《机器学习实战》第十章错误总结

这一章完成后发现自己的基础还不牢固,先来复习下基础 ( )———元组tuples [ ]———列表list { }———字典dict 尤其是列表list,一定要看清有多少个[ ]下边的错误就是由于基础不牢导致的return np.matrix(centList), clusterAssment提示错误ValueError: matrix must be 2-dimensional 或者Ty

2017-09-18 17:13:41 3732

原创 python自带的sum()函数和numpy库中的sum()函数的区别

在学习《机器学习实战》一书的第十章时,对return np.sqrt(sum(np.power(vecA - vecB, 2)))这样一条语句输出的结果老是不对,明明想要输出的是对两个列向量的差的平方求和后再开方,输出的应该是一个float型数值,但是这条语句执行后输出的却是一个包含两个值的行向量matrix([[ 5.112672, 0.860815]])而且我将这两个值分别平方后再相加,再开方

2017-09-18 10:53:52 5693

原创 python3+matplotlib+tkinter

1.python3中的tkinter要全部小写,是自带的不需要下载(python2需自行下载)2.还是基于《机器学习实战》一书中的第九章例子来说。函数的顺序很重要!很重要!很重要!!!3.提示错误ValueError: Masked arrays must be 1-D是由于reDraw.a.scatter()里面的前两个参数应该为list类型,而目前的类型是matrix类型,只需要给两个

2017-09-15 15:54:07 965

原创 《机器学习实战》第九章

在学习《Machine Learning in Active》的第九章时,由于自己使用的是python3所以在测试代码时出现了不少错误,下面就做一下整合,并给出解决方法1.NameError: name 'errType' is not defined最开始提示NameError: name 'errType' is not defined错误,所以我就把函数createTree()和ch

2017-09-14 14:57:15 1479 1

原创 python3.5将list类型转换为矩阵类型

在python3中,取消了mat()函数,转而用matrix()代替这个函数的作用是将list类型转换为numpy库中的矩阵类型

2017-09-11 09:51:01 2353

原创 《机器学习实战》朴素贝叶斯

机器学习实战的朴素贝叶斯一章中的源文件老是提示IndexError: range object index out of range看源码里怎么都不会溢出啊,除非minLen为0;所以看了下测试集中的两个链接,第一个链接打开后是正常的,第二个打不开了,所以问题就出在这里了,minLen确实等于0了,怎么修改呢?只好把挂掉的链接换一个新的,我换的是参考资料:http://www.cnbl

2017-09-08 14:38:11 647

转载 UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence

在做《机器学习实战》里的朴素贝叶斯算法时提示错误UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence查阅资料后是文件里有个乱码在23.txt里第二行去掉那个?就可以了,原因我也不是很懂先转载过来,学习下转载自:http://blog

2017-09-08 11:37:14 2440

原创 python提示错误TypeError: write() argument must be str, not bytes

还是在学习《Machine Learning in Action》中决策树一章中,在学习决策树存储过程中先是提示错误TypeError: write() argument must be str, not bytes,看错误信息是说write()函数的参数必须为str,而不是字节bytes。不明白,看源码哪里提示错误了,pickle.dump(inputTree,fw)这一条语句编译时出错了,那么

2017-09-07 14:28:40 35707 2

原创 python 提示错误AttributeError: type object 'str' has no attribute '_name_'

在做《Machine Learning in Action》书中的第三章绘制树形图时遇到了这个问题AttributeError: type object 'str' has no attribute '_name_'很明显是if type(secondDict[key])._name_  == ‘dict’:这一句有问题,在python3中并没有type(secondDict[key])._n

2017-09-07 10:29:32 57297 1

原创 python提示错误TypeError: 'dict_keys' object does not support indexing

python提示错误TypeError: 'dict_keys' object does not support indexing原因:python2与python3之间的差异python2中形如myTree.keys()[0]这样的写法是没有问题的,因为myTree.keys()返回的是一个list;而在python3中myTree.key()返回的则是dick_keys类型,故而出

2017-09-07 09:49:01 11508

原创 xx = [example[x] for example in xxx]功能解析

在学习《Machine Learning in Action》书中的第三章决策树,遇到了featList = [example[i] for example in dataSet]这样一条语句,看半天看不懂,于是直接在python中使用一下,话不所说,直接上图。

2017-09-06 14:33:37 700

原创 在使用python语言的open函数时,提示错误OSError: [Errno 22] Invalid argument: ‘文件路径’

如题,在使用python语言的open函数时,提示错误OSError: [Errno 22] Invalid argument: ‘文件路径’,在查阅了大量资料后也得到了一些解决方案,但是这些解决方案对于作者的情况都不适用,依然报错,没办法,虽然作者的英语水平很不咋地,但中文帮不了作者,只好求助于英文了。       建议各位看客在修改时,仔细看清楚自己的情况是否适用。废话不多说,开始正文。

2017-09-06 09:20:44 76054 12

《解决问题最简单的办法》

当遇到困难时,你该怎么做?本书旨在交给你一些解决问题的方法。

2018-03-16

python的中文分词库smallseg

python的中文分词库有多个,jieba、thulac都可以在GitHub上下载到,但是smallseg需要在code.google上下载,所以只上传了smallseg

2018-01-03

机器学习实战PDF

本文档为《Machine Learning in Action》中文版PDF,是影印版,但不影响阅读,配套资源也已经上传,在另外一个资源里,最后请大家支持正版。

2017-09-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除