数据分析
文章平均质量分 50
lixiaotaoplus
share my views
展开
-
hive返回星期几的方法
熟悉hive的人都知道,在原生版本中,目前并没有返回星期几的函数。为了解决这个问题,除了利用java自己编写udf外,也可以利用现有hive函数实现。原创 2014-12-30 16:49:54 · 16330 阅读 · 0 评论 -
hive 处理敏感字段
hive使用regexp_replace函数,处理敏感字段。原创 2015-03-02 18:10:16 · 7028 阅读 · 0 评论 -
hive 获取每个城市30%的订单
使用hive,获取每个城市30%的订单。笔者第一反应,是使用row_number()函数解决这个问题。但是row_number()是用来排序的,获取30%的订单还需要额外进行一次join。原创 2016-03-02 11:07:01 · 3090 阅读 · 1 评论 -
Hive "行转列"和"列转行"
在HIVE实际开发过程中,我们会遇到“行转列”和“列转行”的场景。比如:1、 需要取“订单号”对应的所有商品“SKU号”,商品“sku号”放在一列,即从table1查询出table2;2、 当商品“sku号”均在一列的时候,需要查询每个“sku号”对应的“订单号”,即从table2查询出table1。table1:order_iditem_sku原创 2015-02-23 15:51:06 · 6644 阅读 · 0 评论