hive数据文件格式和压缩格式

本文介绍了Hive中的文件格式,分为面向行和面向列两大类,并探讨了压缩格式,包括可切分和不可切分两种类型。
摘要由CSDN通过智能技术生成

.文件格式

文件格式按面向的存储形式不同,分为面向行和面向列两大类文件格式。

面向行、列类型 类型名称 是否可切割计算 优点 缺点 适用场景
面向行 文本文件(.txt) YES 查看编辑简单

无压缩占空间大,传输

压力大,数据解析开销大

学习练习使用
面向行

SequenceFile序列

文件格式(.seq)

YES

自支持、二进制KV

存储,支持行和块的

压缩

本地查看不方便,小文件合并

成KV格式后不易查看内部数据

生产环境使用

map输出的默认

文件格式

面向列 rcfile文件格式(.rc) YES

数据加载快,查询快,

空间利用率高,高负

载能力

每一项都不是最高 学习生产均可
面向列 orcfile文件格式(.orc) YES

兼具rcfile优点、进一步

提高了读取、存储效率、

新数据类型的支持

每一项都不是最高 学习生产均可
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值