hive sql
weixin_39793442
这个作者很懒,什么都没留下…
展开
-
SQL查询连续七天以上的用户(用户一天一次记录 & 一天多次记录)
SQL查询连续七天以上的用户创建表格create table orde(id varchar(10),date datetime,orders varchar(10));insert into orde values(‘1’ , ‘2019/1/1’,10 )insert into orde values(‘1’ , ‘2019/1/2’,109 )insert into orde va...原创 2019-12-05 10:51:47 · 4267 阅读 · 0 评论 -
hive sql实现随机样本的选取
hive实现数据抽样一般有三种方法(参考http://www.bubuko.com/infodetail-1022686.html):1. 数据块抽样 (tablesample()函数)利用tablesample() 函数, 根据hive表数据的大小按比例抽取数据,并保存到新的hive表中。例子: 将原hive表10%的数据存到新表,但是select语句不能带where条件且不支持子查询,需要通过建中间表或随机抽样解决。create table xxx_new asselect *...原创 2020-07-24 18:00:15 · 3213 阅读 · 0 评论