6、hive中的file_format

本文探讨了Hive中的不同文件格式,包括SEQUENCEFILE、TEXTFILE(默认格式)、RCFILE、ORC和PARQUET,以及它们在HDFS中的存储差异。介绍了如何设置和查看Hive的默认文件格式,以及各种格式的压缩选项。例如,ORC和PARQUET提供了高效的压缩和性能,而SEQUENCEFILE通常不推荐使用。
摘要由CSDN通过智能技术生成

行存储和列存储在hdfs中的区别

7552712af1180fa442d5af31ca81706568a.jpg

hive中的file_format

可以使用set hive.default.fileformat来查看和设置格式
set hive.default.fileformat
默认是TextFile

file_format:【查看hive官方文档】
  : SEQUENCEFILE 【文件比原始文本文件还要大;不适用】
  | TEXTFILE    -- (Default, depending on hive.default.fileformat configuration)
  | RCFILE      -- (Note: Available in Hive 0.6.0 and later)【性能也比较低;减少百分之10空间】

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值