手撕项目-Flink电商实时分析七

目录

 

回顾

后续分析

本地Mysql数据库添加部分电商数据

安装Mysql和Hive

总结


回顾

 

上篇中addSink一直没有执行,后来在countWindow中加了第二个参数(slide)莫名可以执行,【还可能和kafka不稳定有关系】

 

 

后续分析

 

本次编写了浏览地区分布、网络、浏览器使用分析代码,与之前的分析大致类似就不粘贴代码了,代码均已更新到文末github中,可自行浏览。

 

 

本地Mysql数据库添加部分电商数据

 

手动创建部分电商信息

 

安装Mysql和Hive

 

下载apache-hive-1.0.0-bin.tar.gz、MySQL-5.5.53-1.linux2.6.x86_64.rpm-bundle.tar

安装mysql

进入目录执行:

rpm -i MySQL-server-5.5.53-1.linux2.6.x86_64.rpm 

可能报如下错误:需删除mariadb-libs-1:5.5.52-1.el7.x86_64

执行:rpm -e mariadb-libs-1:5.5.52-1.el7.x86_64 --nodeps

继续执行

安装成功如下:

启动mysql服务

mysqld_safe &

安装客户端

rpm -i MySQL-client-5.5.53-1.linux2.6.x86_64.rpm

执行命令mysql_secure_installation

设置root用户密码(我设置123456)

mysql -uroot -p123456

安装hive

tar之后,添加hive-site.xml

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
</property>
<property>  
  <name>hive.metastore.warehouse.dir</name>  
  <value>/user/hive/warehouse</value>  
</property>
<property>  
  <name>hive.metastore.local</name>  
  <value>true</value>  
</property>
</configuration>

 

没有配置hadoop环境变量的需要配置一下

添加驱动包(mysql-connector-java-5.1.40-bin.jar)到hive的lib目录下

修改mysql权限

grant all on hive.* to 'root'@'%' identified by '123456';
flush privileges;

 

连接hive如图:

 

 

总结

 

修改之前的bug,编写浏览地区分布、网络、浏览器使用分析代码;添加电商模拟数据安装mysql和hive;

之后通过sqoop同步电商数据。

具体代码可参照我的git项目地址,现有代码均已通过测试可以使用,后续会持续更新,直到项目结束,不懂的细节,可以关注公众号:阿清的日常,后台留言,会细致解答。

git地址:https://github.com/jyqjyq/filnkDS.git

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
上百节课视频详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 本课程采用由浅入深,层层递进的讲解方式, 让你轻松掌握企业级数仓架构的搭建及使用, 使用该架构可以胜任企业级实时数仓和离线数仓构建。 课程内容: 1. 项目背景介绍 2. 数据建模应用 3. 基于Kylin的OLAP分析 4. 需求分析项目设计 5. 订单与销售额指标计算 6.行为指标计算 7.Druid的安装和使用 8.流式数仓实现 适用人群: 1、对企业级数据仓库构建感兴趣,有一定大数据基础。 2、对目前职业有进一步提升要求,希望从事数据行业高薪工作的在职人员。 3、对数据行业感兴趣的相关人员。 基础课程主讲内容包括: 阶段一:千亿级实时数仓项目总体介绍 1. 数据仓库在企业里面的重要性 2. 千亿级实时数仓的项目演示 阶段二: 数据建模的应用 1. 为什么要数据建模 2. 维度和指标的概念 3. 指标和维度建模案例 阶段三. 数据仓库从0到1的过程 1. 数仓典型分层思想(ODS、DWB、DWS、DM、ADS) 2. 数仓建设0到1的过程实战 3. 企业级数据仓库设计的规范 阶段四:基于Kylin的OLAP分析 1. Kylin自带的example案例介绍 2. Kylin的Cube创建 3. Kylin的数据膨胀介绍 阶段五:需求分析项目设计 1. 需求分析 2. canal搭建 3. canal数据写入kafka 阶段六:订单与销售额指标计算 1. 销售额指标体系介绍 2. flink实时消费Kafka订单数主题数据 3. 订单金额指标统计 阶段七:行为指标计算 1. 模拟通过埋点方式采集行为数据 2. 使用Flink Streaming计算用户行为相关指标 3. Flink CEP实现转化率分析 阶段八: Druid的安装和使用 1. Druid实时数据摄入 2. Druid基于JSON查询语法 3. Imply Pivot可视化数据分析

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值