http://lintool.github.io/Cloud9/ 这个网站介绍了一些数据挖掘方面使用hadoop开发的工具集
http://book.douban.com/subject/4879588/ 介绍了上个网站的一本书
http://www.cnblogs.com/mdyang/archive/2011/06/29/data-intensive-text-prcessing-with-mapreduce-contents.html 第一个网站的书的中文版
http://lintool.github.io/MapReduce-course-2013s/slides/session07.pdf 例如其中的一本书