hive 分隔符 ^A

0.hive 去重


select * from (select *,row_number() over (partition by id order by name asc) num from table) t where t.num=1;  

id ,name 为列名


0 hive排序

select pin,pro,row_number() over (distribute by pin sort by pro desc) rownum from cf_dev.sy_CAREER_source_pro;




1.^A 的实际编码为\001


2.having子句

having 可以对 group by 产生的分组进行条件过滤

例:

select keyword,count(*) from cf_dev.sy_corporation_ad group by keyword having count(*) > 1000;


3.join的优化

多表查询应保证从左到右的顺序为由小到大。

join 内连接 只显示两表相同的部分

left outer join 以左表为主,右表对应部分显示NULL


select a.pin,b.address from a join b on a.pin = b.pin


distribute by 控制map的输出在reduce中如何划分。

order by 控制reduce的输出排序


4.union all 多表合并

select * from XXX

union all

select * from XXX


5.随机查询

select * from tablename TABLESAMPLE(bucket 3 out  of 10 on rand()) s;


6.改表名

alter table tablename RENAME INTO new_talbename;


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值