hive
sd6364152
这个作者很懒,什么都没留下…
展开
-
sql技巧
1.子查询的对比1) 传统子查询:子查询如果嵌套的层次过多,会使SQL语句非常难以阅读和维护.2) 表变量:将子查询放在了表变量@t中,这样做将使SQL语句更容易维护,但又会带来另一个问题,就是性能的损失。表变量实际上使用了临时表,从而增加了额外的I/O开销,因此,表变量的方式并不太适合数据量大且频繁查询的情况。3) CTE:比表变量效率更高。--1.传统子查询SELECT *FROM person.StateProvinceWHERE CountryRegionCode原创 2020-09-03 15:55:45 · 612 阅读 · 0 评论 -
2020-08-20
hive优化手段无非四种:1.合理控制map和reduce数2.合并小文件3.避免数据倾斜,解决数据倾斜4.减少job数(合并job,大job分拆。。。)原创 2020-08-20 11:15:03 · 90 阅读 · 0 评论