区分insert into 和 insert overowrite:
1、insert into 语句
Hive> insert into table account select id,age,name from account_tmp;
2、insert overwrite语句
hive> insert overwrite table account2 select id,age,name from account_tmp;
--------------------
也就是说 overwrite会覆盖现有的数据,而into是直接将数据写入库。
如果需要的是去重的数据,那么应该选择overwrite作为插入的方式。