1.hadoop中飞飞对原始的hdfs文件进行了压缩,采用的 LZO压缩算法,理由是这种压缩比高,LZO 是什么,需要了解一下
下面摘自《hadoop开发者》书刊中的一张图片
2. 飞飞对map 的输出也使用了一种压缩 - snappy,这种压缩的压缩比不是太高,但解压和和压缩的速度快,需要了解一下。
http://www.infoq.com/cn/news/2011/04/Snappy 对snappy有所解释
3.hadoop中的shuffle 和combine 是怎么一回事儿?
1.hadoop中飞飞对原始的hdfs文件进行了压缩,采用的 LZO压缩算法,理由是这种压缩比高,LZO 是什么,需要了解一下
下面摘自《hadoop开发者》书刊中的一张图片
2. 飞飞对map 的输出也使用了一种压缩 - snappy,这种压缩的压缩比不是太高,但解压和和压缩的速度快,需要了解一下。
http://www.infoq.com/cn/news/2011/04/Snappy 对snappy有所解释
3.hadoop中的shuffle 和combine 是怎么一回事儿?