Hive
Resemble_
一只程序猿的奇思妙想
github: https://github.com/Resemble
展开
-
重要SQL记录
同环比select '日环比' as datekey, if(b.total_poi_num=0,0,round(cast(a.total_poi_num as double)/b.total_poi_num-1,4)) as total_poi_num from ( select datekey, 'all'...原创 2018-03-20 20:01:28 · 1478 阅读 · 0 评论 -
由于LEFT JOIN错误使用导致的数据不一致问题
msyql语句执行顺序 代码的执行顺序: from... where...group by... having.... select ... order by... hive 语句执行顺序 大致顺序 from... where.... select...group by... having ... order by...LEFT JOIN有一个作用就是用于去除表A中表B的数据,现在我...原创 2018-04-04 12:21:05 · 5872 阅读 · 2 评论 -
Hive
目录 函数窗口函数普通函数Tips空字符串和Null的问题普通tips函数窗口函数 NTILE 用于将分组数据按照顺序切分成n片,返回当前切片值。 比如,统计一个cookie,pv数最多的前1/3的天。 ROW_NUMBER 从1开始,按照顺序,生成分组内记录的序列。 比如,按照pv降序排列,生成分组内每天的pv名次; 再比如,获取分...原创 2018-08-09 11:16:20 · 153 阅读 · 0 评论 -
从sql关联数据异常看精度丢失问题
目录背景代码测试:测试结果:结果说明:原因分析:float与double的范围和精度解决方案:背景bigint和string做join的时候 会先都隐式转换成double在join,可能会由于精度丢失导致join的结果不符合预期,导致sql不符合预期代码测试: set hive.mapred.mode=nonstrict;select 90000...原创 2019-10-08 22:56:25 · 999 阅读 · 0 评论