hdfs
文章平均质量分 59
王诗龄
这个作者很懒,什么都没留下…
展开
-
hdfs的回收站
在Linux操作系统下面,如果用户删除了某一个文件或者是某一个文件目录,操作系统并不会把这文件从文件系统中真正删除,而是先把它放入回收站中,这样在用户误操作的情况下还能找回原文件,以防止给用户造成中大损失。实际上,HDFS也为用户提供了类似这样的一个功能,但是这样的功能只限于用户在客户端的脚本操作,也就是HDFS的shell命令,而当用户写程序调用HDFS的API时,NameNode并不会把删...原创 2014-07-09 19:06:57 · 228 阅读 · 0 评论 -
hadoop fsck命令详解
hadoop fsckUsage: DFSck [-move | -delete | -openforwrite] [-files [-blocks [-locations | -racks]]] 检查这个目录中的文件是否完整 -move 破损的文件移至/lost+found目录...原创 2015-01-06 12:49:09 · 199 阅读 · 0 评论 -
hadoop集群balance工具详解
在线上的hadoop集群运维过程中,hadoop 的balance工具通常用于平衡hadoop集群中各datanode中的文件块分布,以避免出现部分datanode磁盘占用率高的问题(这问题也很有可能导致该节点CPU使用率较其他服务器高)。 1) hadoop balance工具的用法:To start:bin/start-balancer.sh [-threshol...原创 2015-01-06 12:52:51 · 192 阅读 · 0 评论 -
hadoop的管理命令 dfsadmin
dfsadmin是一个多任务的工具,我们可以使用它来获取HDFS的状态信息,以及在HDFS上执行的一系列管理操作。调用方式例如:Hadoop dfsadmin -reportdfsadmin命令详解-report:查看文件系统的基本信息和统计信息。-safeadmin enter | leave | get | wait:安全模式命令。安全模式是NameNo...原创 2015-01-06 16:34:04 · 534 阅读 · 0 评论 -
hdfs 的集中式缓存
[color=red]集中缓存有两层概念:[/color]第一层是缓存,即为存储在HDFS中文件提供缓存的机制,从而可以加速DFSClient对文件的读操作;第二层概念是集中式的管理,传统的HDFS缓存依赖了OS本身的缓存机制,但是这种缓存机制不能被管理员或中央节点进行管理,不能自由的控制哪些文件缓存,哪些文件不进行缓存;集中式的管理可以提高了对缓存内存的可控性;[color=red]...原创 2015-03-05 10:06:58 · 292 阅读 · 0 评论 -
hdfs 的分布式缓存
DistributedCache是Hadoop提供的文件缓存工具,它能够自动将指定的文件分发到各个节点上,缓存到本地,供用户程序读取使用。。它具有以下几个特点:缓存的文件是只读的,修改这些文件内容没有意义;用户可以调整文件可见范围(比如只能用户自己使用,所有用户都可以使用等),进而防止重复拷贝现象;按需拷贝,文件是通过HDFS作为共享数据中心分发到各节点的,且只发给任务被调度到的节点。Di...原创 2015-03-05 11:07:35 · 409 阅读 · 0 评论 -
hdfs 文件的追加
1、修改hdfs-site.xml [code="java"] dfs.support.append true [/code]2、目前如何在命令行里面给HDFS文件中追加内容我还没找到相应的方法。但是,我们可以通过Ha...原创 2015-07-19 11:07:32 · 746 阅读 · 0 评论