本文为自己翻译的译文,原文地址:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+LZO
LZO 基本概念
LZO是一个无损的数据压缩库,相比于压缩比它更加追求速度。 查阅ttp://www.oberhumer.com/opensource/lzo 和http://www.lzop.org 或缺更多有关 LZO的信息 and 查阅压缩数据存储格式 获取有关Hive压缩数据存储信息。
假设一个有三列的简单数据文件。
- id
- first name
- last name
向这个数据文件中插入4条记录:
19630001 john lennon 19630002 paul mccartney 19630003 george harrison 19630004 ringo starr
调用这个数据文件 /path/to/dir/names.txt
.
为了使它成为LZO文件,我们可以使用lzop实用程序,它将创建一个名字类似