- 经常看到有人根据关键字段汇总数据到另一个内表时,会先判断关键字段是否存在,存在则修改,否则添加,比如下面:
- 这种写法不是不可以,但是为什么不用COLLECT语句更明了呢,有人说COLLECT语句性能不好,那就用事实来说明。
在30万行数据情况下,事实说明两种写法运行时间不是一个级别,用COLLECT 明显比第一种写快3秒左右。
- 然而需要汇总的数据内表推荐使用hash内表,效果更佳,如下:
通过比较第三种写比第二种写法略胜一丢丢,可以忽略。但如果后续要根据关键字从已汇总的内表数据中读取出数据,那hash内表性能超赞。