Hive
hive
大宝宝的小胖胖
这个作者很懒,什么都没留下…
展开
-
日新-日活用户统计hql开发
日新-日活用户统计hql开发需求日活日新将日期写在脚本中传入需求1.建立一个表,来存储每天新增的数据(分区表)2.统计每天的活跃用户(日活)(需要用户的ip,用户的账号,用户访问的时间最早的一条url和时间)3.统计每天的新增用户(日新)日活1.建表映射日志数据create table t_web_log(ip string,url string,time string,uid st...原创 2019-12-23 21:18:01 · 436 阅读 · 0 评论 -
Hive中定义自己的函数
hive中如何定义自己的函数简单思路:1.先写一个java程序,实现你所想要的功能(如传入一个json字符串和脚标,返回值)2.将java程序打成jar包,上传到hive所在的机器上3.在hive命令行中将jar包添加到classpath4.在hive命令中用命令创建一个函数(如myjson)关联自己写的java类Step 1:MyJsonParser类重载父类UDF中的一个方法ev...原创 2019-12-22 11:48:33 · 104 阅读 · 0 评论 -
Hive基本操作
建表create table t_course(id string,name string,amout float)row format delimitedfields terminated by ‘,’;分区表同一目录下的子目录不同create table t_pv_log(ip string,commit_time string)partitioned by (day strin...原创 2019-12-15 21:41:03 · 403 阅读 · 0 评论