Flink电商实时数仓项目部署上线

Flink实时数仓部署

  1. 将common作为一个自定义的依赖部署到maven中
  2. 使用maven将各个子模块打包
  3. 可以使用FLink框架进行jar包的提交运行。

StreamPark

一个易于使用的流处理应用开发框架和一站式流处理操作平台和管理流应用。它提供了Flink和Spark编写流的脚手架。

  1. Core:可以使用FlinkSQL来编写简单的业务逻辑
  2. pump:提供各种连接器
  3. console:控制台,集成了项目编译、发布、参数配置、启动、保存点、火焰图、监控等功能(重点)

安装StreamPark

  1. 安装Linux的maven, 可以去检查一下版本目前是否还存在。
  2. 解压到/opt/moduel目录下
  3. 创建软链接,连接bin/mvn 和/usr/bin/mvn这两个目录
  4. 修改镜像源为国内的阿里镜像
  5. 上传streamPark的jar包
  6. 将mysql目录下的conncector连接器jar包复制到到streamPark的lib目录下
  7. 运行建库和建表的脚本在这里插入图片描述
  8. 修改配置文件application.yml
    • profiles.actives: mysql 改为mysql
    • 工作目录
      • local:/opt/module/stream_park_workspace
      • remote: HDFS路径
    • 配置mysql.yml

项目部署

  1. 打开Gitee或gitLab,复制仓库地址
  2. 复制到仓库地址到StreamPark中,点击构建项目,此时会下载各种依赖jar包,需要等待一会
  3. 上传common模块的jar包到HDFS中
  4. 添加作业,使用自定义代码,配置一些常用的参数
  5. 启动hadoop, yarn, zookeeper,redis等框架
  6. 发布作业

数据接口可视化

dws层已经把轻度聚合的结果保存到了Doris中,后续只要从Doris读取数据再做简单聚合即可。数据可视化主要看面向两种客户:

  • 数据开发人员
  • 普通客户

在这里插入图片描述

Suglar可视化

  1. 登录百度云,即可免费试用一个月
  2. 创建空白大屏
  3. 在数据->静态Json可以查看一下数据展示所需的格式
  4. 创建gmall-publisher项目,Spring boot架构
  5. 确定对外的服务端口号为8070,读取Doris数据的端口号为9030
  • 10
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值