最近接到项目时关于大数据采集,每月定期要进行统计刷新,看到网上的方法都是update,并没有表名实际的操作流程,下面分享一下我的经验,上代码。
业务表:table_old
备份表:table_old_bak
1、备份(遇事先备份总没错)
drop table if exists `table_old_bak`;
create table table_old_bak
select * from table_old;
2、删除业务数据
第一方式
truncate table table_old;
第二方式
drop table table_old;
备注:清空大数据量最好不要用delet,影响性能,时间用时长!!!!
3、统计同步
字段就用cloumn1进行表示,切记where一定要将所有维度都加上。
#插入先从备份表获取源数据,再从其他表拿出相同字段值进行累加,cloumn3是要累加的字段,例如金额
insert into table_old
(cloumn1, cloumn2, cloumn3)
select cloumn1, cloumn2, cloumn3
from table_old_bak old,
(select cloumn1, cloumn2, sum(ifNULL(cloumn3, 0))
from table_new gropy by cloumn1, cloumn2) new
where old.cloumn1 = new.cloumn1
AND old.cloumn2 = old.cloumn2
然后这运行速度杠杠的