今天工作,不小心insert overwrite 错了一张表,内心无比惊慌,不知如何是好,赶紧百度,赶紧解决。
事情起因:数据表的迁移过程中,有时候需要临时表进行中转。于是我建了一个tmp临时表,来对接原表的数据,本应该是这么写的hive语法,
insert overwrite table_name_tmp select * from table_name where + 筛选条件
可能中午没睡好,有点懵,结果写成这样
insert overwrite table_nameselect * from table_name_tmp where + 筛选条件
我一查表中数据为空(自信以为没有问题),又查了一下原表数据也为空(之前有数据的),顿时感觉不妙。
解决方法:
- hdfs dfs -du -h /user/hive/.Trash/Current/user/hive/warehouse/数据库名称
- 复制数据到原数据路径 hdfs dfs -cp /user/hive/.Trash/Current/user/hive/warehouse/数据库名称/数据表名 /user/hive/warehouse/数据库名称
- select * from 表名 进行检验数据
对于第一步如果找不到可以 hdfs dfs -du -h 查看一下是否有 .Trash 这个路径,有的话就可以一步一步往下走了。
对于不小心drop的数据表也是这样啊,嘻嘻。