从hive-0.11.0开始,有了ORCFile,下面是我的测试结果,测试用的是hive-0.12.0
压缩很明显,默认使用ZLIB压缩很慢,只有一个map,改用SNAPPY后速度不错,压缩的也不错,就是目前还有bug,比如https://issues.apache.org/jira/browse/HIVE-5568
参考资源:
http://hortonworks.com/blog/orcfile-in-hdp-2-better-compression-better-performance/
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+ORC