Hadoop archives 说明

最新推荐文章于 2021-10-15 13:21:04 发布

KNIFE_PAN

最新推荐文章于 2021-10-15 13:21:04 发布

阅读量556

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/KNIFE_PAN/article/details/44153975

版权

Hadoop 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1.创建归档文件(会执行maprreduce)

hadoop archive -archivename test.har /test/vot/ /test/har/

2.查看归档文件

hdfs dfs -ls -R har:///test/har/vot.har

hdfs dfs -ls -R har://hdfs-dns:9000/har/vot.har（外部访问）

3.说明

1创建archive文件要消耗和原文件一样多的硬盘空间

2archive文件不支持压缩，尽管archive文件看起来象已经被压缩过了。

3archive文件一旦创建就无法改变，你要改一些东西的话，你需要创新创建archive文件

4虽然解决了namenode的内存空间问

但是在执行mapreduce时，仍然会把每个文件当做一个map的输入（前提文件小于块大小）

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hadoop archives 说明

1.创建归档文件(会执行maprreduce)hadoop archive -archivename test.har /test/vot/ /test/har/2.查看归档文件hdfs dfs -ls -R har:///test/har/vot.harhdfs dfs -ls -R har://hdfs-dns:9000/har/vot.har（外部访问）3.说明1创
复制链接

扫一扫

专栏目录

KNIFE_PAN CSDN认证博客专家 CSDN认证企业博客

码龄10年

54: 原创

76万+: 周排名

125万+: 总排名

18万+: 访问

: 等级

1877: 积分

8: 粉丝

25: 获赞

12: 评论

49: 收藏

私信

关注

热门文章

分类专栏

Hadoop 11篇
Java 1篇
Android
Hbase 3篇
Linux 8篇
MySQL 3篇
web 5篇
System 1篇
Eclipse 2篇
DNS
Log 1篇
Javascript 1篇
Hive 9篇
hbase数据
hbase数据集群间手动迁移 1篇
cloudera 1篇
sqoop 1篇
scala 1篇
spark 3篇

最新评论

MySql创建hive用户，并赋予权限
auarice: 密码不符合策略要求怎么解决
hdfs dfs -du -h 输出三列数据的含义
HellooWooorld: 这些命令没有官方解释吗
cloudera-scm-agnet 启动报错找不到libpython2.6.so.1.0
A Lonely Brave Mofo: 这是什么问题？
hdfs dfs -du -h 输出三列数据的含义
qq_44258482:
Hive 修改表添加分区（add partition）和加载数据时添加分区的区别
CYJ_fightman: [code=javascript] 2.对于内部表 empl_inn // 执行添加分区时 vod_pb/ 文件夹下的数据不会被移动。并且没有分区目录logdate=2015-02-26 alter table empl_inn add partition (logdate=‘2015-02-26’) location ‘hdfs://nameservice1/vod_pb/’; // 执行删除分区时vod_pb/ 下的数据会被删除并且连同vod_pb/文件夹也会被删除 alter table empl_inn drop partition (logdate=‘2015-02-26’); // 执行加载数据添加分区时 vod_pb/ 文件夹下的数据会被移动，并创建分区目录logdate=2015-02-26，数据移动到此目录下 load data inpath 'hdfs://nameservice1/vod_pb/' overwrite into table empl_inn partition(logdate='2015-02-26'); // 执行删除分区目录时，已经创建logdate=2015-02-26/分区目录会被删除，其文件夹下的数据随之会被删除； alter table empl_inn drop partition (logdate=‘2015-02-26’); [/code]

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。