Hive中文件存储格式及大小比较测试

在hive中创建表是有如下一个语句

[ROW FORMAT row_format]

row_format 的类型有如下:

file_format:
: SEQUENCEFILE
| TEXTFILE -- (Default, depending on hive.default.fileformat configuration)
| RCFILE -- (Note: Available in Hive 0.6.0 and later)
| ORC -- (Note: Available in Hive 0.11.0 and later)
| PARQUET -- (Note: Available in Hive 0.13.0 and later)
| AVRO -- (Note: Available in Hive 0.14.0 and later)
| INPUTFORMAT input_format_classname OUTPUTFORMAT output_format_classname
默认是文本格式例如:

我有几张阿里云幸运券分享给你,用券购买或者升级阿里云相应产品会有特惠惊喜哦!把想要买的产品的幸运券都领走吧!快下手,马上就要抢光了。
700

按照数据存储方式分类

官方文档地址
https://cwiki.apache.org/confluence/display/Hive/SerDe

按照行存储

SEQUENCEFILE
TEXTFILE

按照列存储

RCFILE
ORC
PARQUET

说明:parquet目前已经是apache的顶级项目了,在hive,hbase,spark中都是经常使用的。

原文链接

folder Size是最好的一个文件大小浏览工具了,可以拖入文件夹,操作方便 folder Size是一款用于系统硬盘查看对比的工具,它可以帮助你查看系统的磁盘文件使用状态,同时支持显示每个磁盘的文件文件夹所占用空间的大小百分比,让你更加直观的了解您的磁盘空间分配情况。此工具拥有简洁的操作界面,拥有快速的扫描功能,仅需要几分钟的时间就可以检测完成。 功能特色: 查找并显示所有文件文件大小。 扫描整个存储设备或选择的文件夹。 在不同的图表-柱状图,饼图显示文件文件夹的大小等 在表列出所有文件文件夹的详细信息: 名称 文件大小 从父文件夹的大小的百分比的大小 文件夹数 子文件夹数 创建时间 上次修改时间 上次访问时间文件夹的所有者和组 上述排序选项列出所有不同的标准- 基于文件夹的名称,文件大小等 重新排列的选项列表的列,以适应您的偏好。 找到Windows资源管理器选择通过上下文菜单文件夹或文件 删除文件夹或文件。 相关的应用程序打开文件使用双击。 对于所有类型的存储设备支持 -硬盘驱动器,光驱,usb驱动器,软盘 简易资源管理器风格的导航通过后退,前进和文件夹向上工具按钮 使用方法: 1、下载Folder Size软件,安装。 2、软件安装完成以后,自动与Windows资源管理器集成在一起。以Windows XP为例,打开资源管理器,单击“查看→详细信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值