大数据
guoxy_nb
这个作者很懒,什么都没留下…
展开
-
Hive语言手册之四:压缩数据存贮与应用
一、压缩数据存储有时候,Hive Table中的压缩数据比不压缩的数据在磁盘读取与查询性能方面都有比较好的性能。可以把使用GZip或BZip2压缩的文本数据直接导入到Hive,并且以TextFile格式进行存储,Hive可以识别压缩的数据并且在查询时进行实时解压,例如:CREATE TABLE raw (line STRING) ROW FORMAT DELIMITED翻译 2014-04-15 20:35:02 · 1519 阅读 · 0 评论 -
Hive语言手册之五:ORC文件格式
一、ORC文件格式ORC File Format ORC从Hive0.11开始引入。Introduced in Hive version 0.11.ORC(Optimized Row Columnar)格式可以高效地存储Hive数据,被设计用来避免其他文件格式存在的缺陷,使用ORC文件可以提升Hive读、写与处理数据的性能。ORC文件格式有以下优点:翻译 2014-04-24 21:23:30 · 6448 阅读 · 0 评论