4.1 准备工作
4.1.1 使用 phoenix 在 hbase 中建表
(1)解压 squirrel-sql-3.9.1.zip
![](https://i-blog.csdnimg.cn/blog_migrate/0763104697ea50a31ea200677df729af.png)
(2)在解压后的目录双击运行 squirrel-sql.bat
(3)添加 phoenix 驱动
(4)具体驱动配置如下
◼
Example URL
jdbc:phoenix:hadoop202,hadoop203,hadoop204:2181
◼
Class Name
org.apache.phoenix.jdbc.PhoenixDriver
![](https://i-blog.csdnimg.cn/blog_migrate/e01b31f4f77ca315afc840bd0aae4a89.png)
(5)创建连接
提前启动好 hdfs 以及 hbase
![](https://i-blog.csdnimg.cn/blog_migrate/6d7208dc8a6ee2593958316c811d4145.png)
(6)连接后,查看数据库对象
(7)执行 SQL 语句
(8)调整字体大小
(9)执行建表以语句
create table user_status2020( user_id varchar primary key ,state.if_consumed
varchar ) SALT_BUCKETS = 3
4.1.2 在 pom.xml 文件中加入相关依赖
4.1.3 创建样例类
(1)创建 OrderInfo 样例类
![](https://i-blog.csdnimg.cn/blog_migrate/925f404437d6d52ef8001607c754980b.png)
(2)创建 UserStatus 样例类
4.1.4 创建 phoenix 查询工具类 PhoenixUtil
4.2 读取订单信息,查询用户状态(判断是否首单)
4.2.1 创建业务类 OrderInfoApp,读取订单、维护用户状
态代码
![](https://i-blog.csdnimg.cn/blog_migrate/9bdb9d75739b5134180ffbf69b460f22.png)
4.2.2 测试
◼
启动 ZK、Kafka、Redis、Maxwell、HDFS、Hbase
◼
运行 BaseDBMaxwellApp、OrderInfoApp
◼
修改模拟生成数据日期、运行模拟生成日志的 jar 包
◼
OrderInfoApp 输出结果
![](https://i-blog.csdnimg.cn/blog_migrate/bbe0ed15818890ff414bbc8424b9cb15.png)
4.3
维护用户状态
将用户是否消费的状态保存到 Hbase 中
4.3.1 在 OrderInfoApp 中继续完成代码
![](https://i-blog.csdnimg.cn/blog_migrate/1c1770b76a75ae5dc3ca200c59dcef86.png)
4.3.2 测试
◼
启动 ZK、Kafka、Redis、Maxwell、HDFS、Hbase
◼
运行 BaseDBMaxwellApp、OrderInfoApp
◼
修改模拟生成数据日期、运行模拟生成日志的 jar 包
◼
Hbase 输出结果
![](https://i-blog.csdnimg.cn/blog_migrate/56e1d00d02dfe99d75162dc2dd90a734.png)
4.4
一个采集周期状态修正
➢
漏洞
如果一个用户是首次消费,在一个采集周期中,这个用户下单了 2 次,那么就会
把这同一个用户都会统计为首单消费
➢
解决办法
应该将同一采集周期的同一用户的最早的订单标记为首单,其它都改为非首单
◼
同一采集周期的同一用户-----按用户分组(groupByKey)
◼
最早的订单-----排序,取最早(sortwith)
◼
标记为首单-----具体业务代码
➢
代码
![](https://i-blog.csdnimg.cn/blog_migrate/d0e8038f8716c1c58f4ea3562fb5aa4b.png)