昨天刚从同事那拿到两本关于hadoop的书。
一本是hadoop的committer Tom White的大作《hadoop_The_definitive_guide》,大致看了下前言和目录,非常
详细的介绍了hadoop的各个方面。
另一本《Data-Intensive Text Processing with MapReduce》貌似还没有正式出版,介绍了如何用MapReduce设计一
些算法的技巧,包括常见的连接多个表,Inverted Indexing的实现,包括宽度优先、PageRank等图相关算法,以及
EM、HMM等机器学习算法是现实,总之感觉是本非常棒且实用。
不敢独享,拿出来与大家share.