说明
数据是大数据核心,日常操作hadoop集群免不了删除文件,如果操作失误删除了重要文件,将造成重大事故和损失,如何避免误删,可以开启hadoop集群的回收站功能,误删后,可以从回收站中恢复。
分享
- 大数据博客列表
- 开发记录汇总
- 个人java工具库 项目https://gitee.com/wangzonghui/object-tool
- 包含json、string、集合、excel、zip压缩、pdf、bytes、http等多种工具,欢迎使用。
操作
参数说明
- 主要设置如下参数:
参数名 | 默认值 | 说明 |
---|---|---|
fs.trash.interval | 0 | 0 禁用回收站,其他值为回收站保存文件时间,单位为分钟 |
fs.trash.checkpoint.interval | 0 | 检查回收站间隔时间,为 0 时等于fs.trash.interval的值,要求值不大于fs.trash.interval |
开启回收站
- 修改
core-site.xml
文件,设置垃圾回收时间为1天
<property>
<name>fs.trash.interval</name>
<value>1440</value>
</property>
恢复文件
- 回收站目录:
/user/用户/.Trash/
- 数据恢复,只需要从回收站目录移动大数据目录
注意
- 使用hadoop命令
hadoop fs -rm
删除的才会进入回收站,程序删除的数据不会进回收站,删除操作要谨慎,再谨慎。说多是泪。
总结
- 社区版hadoop的回收站功能需要手动开启,删除的数据会留存一段时间,该功能会占用一定存储资源,但为了数据安全这点资源占用是必须。
- 最近大环境不好,技能学习不能落下,保持好状态,结果如何,看时运看命。加油。