四、MapReduce jobHistory
jobhistory简介
● JobHistory用来记录已经finished的mapreduce运行日志,
● 日志信息存放于HDFS目录中,默认情况下没有开启此功能,需要在mapred-site.xml中配置并手动启动。
配置Jobhistory
1.修改mapred-site.xml
在hadoop软件的/etc/hadoop下
配置MR JobHistory Server管理的日志的存放位置
配置查看历史服务器已经运行完的Mapreduce作业记录的web地址,查看需要启动该服务
2.分发配置到其他两台机器
3.启动jobHistoryServer服务进程
单独启动关闭historyserver 服务(只需要配置指定的机器上启动即可)
mr-jobhistory-daemon.sh start historyserver
mr-jobhistory-daemon.sh stop historyserver
4.页面访问jobhistoryserver
http://node-1:19888/jobhistory 端口号要记住!!!
五、HDFS的垃圾桶机制
1.垃圾桶机制解析
每一个文件系统都会有垃圾桶机制,便于将删除的数据回收到垃圾桶里面去,避免某些误操作删除