SQL
一个很老的小萌新
这个作者很懒,什么都没留下…
展开
-
Hive 算两时间差
无原创 2022-10-12 10:58:54 · 1870 阅读 · 1 评论 -
【HIVE】从URL中提取需要的部分字符串
【HIVE】从URL中提取需要的部分字符串原创 2022-10-10 17:43:23 · 553 阅读 · 0 评论 -
如何利用经纬度计算直线距离 SQL
如何利用经纬度计算直线距离 SQLSource: https://blog.csdn.net/weixin_42382211/article/details/80852786SELECT c.province_name, c.city_name, c.address, d.station_name, d.train_station , CAST(d.distance AS BIGINT)FROM ( SELECT DISTINCT a.station_name, b.station_n原创 2022-03-29 08:47:31 · 332 阅读 · 0 评论 -
计算top榜单内元素的连续上榜天数 2021-08-27
01 制作每日(eventtime,下单日)topN数据集02 对每日(eventtime)topN数据集,按照元素(供应商)分组,对统计日(eventtime)降序;标识某元素eventtime日期序号A03 curday与eventtime比较,计算两者差值B04 过滤 A = B的数据行05 获取持续上榜天数with base0 as( select substr(create_at, 1, 10) as create_date , vendor_name , sum(原创 2021-08-27 14:54:17 · 123 阅读 · 0 评论 -
SQL计算周岁
方法:select name, birth as birthday, if(datediff(CURRENT_DATE, CONCAT(substr(CURRENT_DATE, 0, 4), substr(birth, 5, 7))) >= 0, substr(CURRENT_DATE, 0, 4) - substr(birth, 0, 4), substr(CURRENT_DATE, 0, 4) - substr(birth, 0, 4) - 1) as age fro原创 2021-04-25 11:36:45 · 717 阅读 · 0 评论 -
apache hive解析结构体(structs)、数组(arrays)和字典(map)
数据仓库工具hive提供了复合数据类型:结构体(struct): 基于对象的数据结构形式,struct内部的数据可以通过(.)来存取,例如,表中一列user的类型为STRUCT{name string; age int},我们可以通过user.name来访问域name 数组(array):基于数据(列表)的数据结构形式,array中的数据为相同类型,例如,假如array中元素['a','b','c'],则array[1]的值为'b' 字典(map):基于key-value的数据结构形式,map访问指转载 2021-04-07 14:35:08 · 1930 阅读 · 0 评论 -
HIVE 求解时间差 & 日期格式转换
1 将时间转换成时间戳2 将时间戳相减3 注意单位(分钟、毫秒)E.x. CAST((unix_timestamp(rt.refund_ticket_time) - unix_timestamp(rt.create_time)) / 60 AS int)<=30原创 2021-03-18 14:01:39 · 883 阅读 · 0 评论 -
闰年同比 HQL;利用add_months实现同比(闭坑闰年)
议题:闰年2月日同比办法:代码块02阅读:https://www.cnblogs.com/huaxiaoyao/p/4364141.htmlselectadd_months('2020-03-31',-1),add_months('2019-02-28',-1),add_months('2021-03-01',-12),add_months('2021-02-28',-12),add_months('2021-02-27',-12),add_months('2020-02.原创 2021-03-03 14:00:51 · 837 阅读 · 0 评论 -
字符串拆分;列转行;2020-08-17
```sqlselect distinct station_id,station_name ,city_name,province_name,ticket_return,ticket_change,ticket_child,ticket_take_child,ticket_voucher,service_fee,date_site,x.y as site,dfrom dw_busdb.tbl_dc_station_new alateral view explode(spli.原创 2021-02-09 15:21:49 · 271 阅读 · 0 评论 -
字符提取函数 get_json_object 、regexp_replace、add_months ;表字段update
1.Json 的支付提取SELECT *,get_json_object(label_value_text,’.BUS′)asaFROMshareindi.edwdidnauserlabel1084wheregetjsonobject(labelvaluetext,′.BUS') as aFROM sharein_di.edw_di_dna_user_label_1084where get_json_object(label_value_text,'.BUS′)asaFROMshareindi..原创 2021-02-09 15:16:15 · 230 阅读 · 0 评论 -
SQL:两表关联取舍时, is null 判断只能单独存在
SQL:量表关联取舍时, is null 判断只能单独存在,不能与其他判断同时进行。错误的写法:select a.user_id,a.uid,a.page_type,a.dfrom( select o.user_id ,f.uid ,f.page_type ,f.d from dw_busdb.for_flow_con...原创 2019-08-07 16:28:04 · 995 阅读 · 0 评论