1.创建归档文件(会执行maprreduce)
hadoop archive -archivename test.har /test/vot/ /test/har/
2.查看归档文件
hdfs dfs -ls -R har:///test/har/vot.har
hdfs dfs -ls -R har://hdfs-dns:9000/har/vot.har(外部访问)
3.说明
1创建archive文件要消耗和原文件一样多的硬盘空间
2archive文件不支持压缩,尽管archive文件看起来象已经被压缩过了。
3archive文件一旦创建就无法改变,你要改一些东西的话,你需要创新创建archive文件
4虽然解决了namenode的内存空间问
但是在执行mapreduce时,仍然会把每个文件当做一个map的输入(前提文件小于块大小)