![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive sql
文章平均质量分 66
数据分析师小陈
这个作者很懒,什么都没留下…
展开
-
HiveSql(1)mapjoin、分区表
mapjoin、分区表、不等值匹配业务需求:A表,小表,穷举的100个动漫电影的IP,表结构ip(id string, key string)B表,大表,每天的交易数据,上亿条,表结构order(ds string, item_titlestring,buyer_id string, fee string)现在想要得到这100个动漫电影相关产品的每天的销售额、购买人数。原创 2016-01-08 17:10:08 · 1571 阅读 · 2 评论 -
HiveSql(2)Lateral view_转行为列
Lateral view_转行为列业务需求:搜索展现表A,表示在搜索一个关键词后,展现出来的商品的列表,一个用逗号分隔的list。但是现在需要解析出list中所有item_id进行分析,此时需要用到lateral view。举例如下:A(session_id, se_keyword string, item_list string)101,功夫熊猫,(1001,1002,100原创 2016-01-12 10:26:10 · 1279 阅读 · 0 评论 -
HiveSql(3)HiveSQL与oracle SQL的区别
HiveSQL与oracle SQL的区别1、hive sql暂时不能使用in,不支持where字句中的子查询。可以利用leftsemi join来实现in。Hive:Select * from employee e left semi joindept d on (e.deptno=d.deptno)小表放在join左边。Left semi join是in/exist在hiv原创 2016-01-13 21:22:05 · 10048 阅读 · 0 评论