![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
deantzzz
扶我起来,我还能写。
展开
-
Ubuntu18.04 hadoop2.7.7+hbase2.0.5单机伪分布式环境搭建
系统:Ubuntu18.04一、添加普通用户1.使用root用户登录ubuntu2.创建名为 dean的普通用户,使用/bin/bash作为shellsudo useradd -m dean -s /bin/base3.设置密码sudo passwd dean输入两次密码:4.添加管理员权限sudo adduser dean sudo5....原创 2019-06-17 17:00:06 · 2420 阅读 · 6 评论 -
Hive函数
手册:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDFhive数据库下标从1开始,含头含尾查看所有内部函数:show functions;直接用常量测试函数:select xxx(x,x,x);select substr('abcdefg',1,3);+------+| _c0 ...原创 2019-08-27 11:09:15 · 559 阅读 · 0 评论 -
Hive复杂数据类型Array、Map、Struct
文章目录ArrayMapdatacreatesearchkeysvaluessizecontainsStructdatacreatesearchArray创建表,字段类型array指定数组分隔符 collection items terminated by ‘:’where 查询需要使用函数数组包含某个值:array_contains(数组名,‘value’)数组长度:si...原创 2019-08-27 14:42:05 · 1138 阅读 · 0 评论 -
使用Hive分析网站访问日志统计日活跃及日新增用户数据、编写脚本
demo文章目录demodemanddatatable createload data日活日新shell脚本demand建立一个表,来存储每天新增的数据(分区表)统计每天的活跃用户(日活)(需要用户的ip,用户的账号,用户访问时间最早的一条url和时间)统计每天的新增用户(日新)data2019-08-15号的数据:192.168.33.6,hunter,2019-08-15 10...原创 2019-08-28 13:25:56 · 1988 阅读 · 1 评论