代码不规范,同事两行泪!
代码不备份,自己两行泪!
早上正常上班,打开集群:昨天的任务全部失败!
打开目录,发现少了conf文件夹,之后又发现analysis文件夹也莫名消失。
没有专门的运维人员进行集群管理和快照保存,作为开发我才发现Hue上删除数据竟然没有用户操作记录,数据找回无望,因为之前写的程序代码都在。只能按照历史数据重新计算,然而这个是同比环比数据,想当初计算出来的时候逻辑改了好几版,原始数据在另一个测试集群上找到了(还不知道准确性)先生成数据再验证数据。
第一步:先从测试集群把数据down到服务器本地
hadoop fs -get /user/conf/ /home/conf
第二步:把服务器本地数据 down到本地笔记本(使用xftp)
第三步:把本地数据上传到生产集群(使用hue)
然后重新生成数据即可,最后把集群上conf hive shell voice等目录全部备份一份,以防以后再出现类似问题。