机器学习需看书籍

如果你只愿意看一本书,那么推荐Bishop的PRML,全名Pattern Recognition and Machine Learning. 这本书是机器学习的圣经之作,尤其对于贝叶斯方法,介绍非常完善。该书也是众多高校机器学习研究生课程的教科书,如Deep Learning的开山鼻祖Hilton在多伦多大学教授机器学习课程(CSC2515)时也选择了这本书。该书电子版在Bishop个人网页提供直接下载。不过提前说明一下,这本书如果看了半年,看完三遍才能理解透,也属于正常。第一遍看不懂很正常,所以需要持之以恒。

http://research.microsoft.com/en-us/um/people/cmbishop/prml/

intel_prml

第二本书就是ESL(The Elements of Statistical Learning)。中文翻译叫统计学习基础,其实这个翻译不够准确,Statistical Learning并非statistics,叫机器学习基础更加准确。该书数学推导,理论系统很完备,结合后面的exercise用R语言自己联系一下,对于理解机器学习的基本方法很有帮助,如:Logistic,Ridge regression等。这本书同样可以在作者网站上直接下载到电子版。

http://statweb.stanford.edu/~tibs/ElemStatLearn/

intel_esl

有了理论基础,再结合一些教授的课程进行学习,效果更好。目前很流行的斯坦福大学机器学习公开课,在网易公开课中甚至都有中文版字幕出来,是非常不错的入门教程。不过个人更喜欢Hilton的机器学习课程。因为你看了上述两本书之后,基础知识基本都OK了,再看Stanford公开课还是基础。而Hilton的课程更加贴近目前的学术研究热点,比如对于Neural network,Deep Belief Nets的介绍,他的课程中包括了最早期的RBM的实现http://www.cs.toronto.edu/~hinton/MatlabForSciencePaper.html 。值得一看。他老人家的课程地址:http://www.cs.toronto.edu/~hinton/csc2515/lectures.html 特别推荐做一做其中的assignments:http://www.cs.toronto.edu/~hinton/csc2515/assignments.html

intel_hinton


这三本都刷过一些,力荐MLAPP。

1. PRML 和 MLAPP有点像,都是罗列ML各种模型,但是PRML比MLAPP更加偏概率解释,有些为了概率而概率。MLAPP比较中立,内容更新一些,而且附件资料充足(有代码)
2. ESL内容侧重 与 “PRML 和 MLAPP” 都不同,细节往往都没有细讲,需要看对应的paper才能搞懂。不算是很适合的入门教材。
3. 此外还有一本 Foundations of Machine Learning

推荐MLAPP。理由如下:
(1)MLAPP对机器学习基本理论(概率、分布、推理)的解释到位,并且前几章专门进行这部分的知识补充、回顾和训练,非常有助于对具体模型的理解,在具体模型需要进行公式推导的时候也很有价值。
(2)MLAPP模型比较全,什么样的模型都有,不仅有基于贝叶斯统计的绝大多数常见机器学习模型,还包括了一些非概率模型或者概率解释很困难的模型。有时候后面这些模型也是有用的,即使你不用不代表跟你同组的人不用,有必要了解这些模型(PRML上这部分模型的资料相对缺乏)。
(3)对于基于概率的模型,有一些模型MLAPP讲的也足够全,毕竟是后编写的书籍,有一些更加符合时代潮流的方法,另外也讲的更细,有些方法如果只进行不深入的了解的话,不用查论文,直接看MLAPP就够了,这本身就是价值。有的方法即使PRML也讲到了,我也认为MLAPP讲的比PRML更优秀,比如kernel和sparse kernel machine。就像上面有人说的,PRML有点为了概率而概率。


展开阅读全文

没有更多推荐了,返回首页