自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 sparkStreaming实现数据库之间秒级数据同步

try {//初始化源数据库//初始化meta数据库receive()} catch {/*** 读取数据并将数据发送给spark*///创建线程读取数据//创建一个新的offset时间戳//读取源数据库中的增量数据//读取源数据库的表所有列字段//按列读取数据到数组中//将读取到的增量数据保存至store中}.start()//重启任务/*** @return*/} else {try {if (stmt!} catch {//配置文件名称if (!

2024-03-18 19:25:40 531

原创 血缘分析工具之整体思路

这部分主要血缘关系的梳理主要是梳理埋点和数仓的贴源层关系,分析埋点和数仓贴源层的关系,需要我们做数据埋点的时候形成埋点文档,确认每个埋点对应的数据接入任务以及每个埋点对应数据仓库对应贴源层的表,每一次的埋点方案需要对应的归档管理,或者有对应的埋点管理系统。这部分是数仓的建设部分,从数仓的贴源层到最终的数据指标模型,指标加工部分,我们一般使用sql的方式来实现, 就需要我们分析模型构建的sql,分析每一条sql的源表和插入表。(2)业务库-》数据进去数仓-》形成指标。(1)埋点-》数据进去数仓-》形成指标。

2024-03-18 14:57:15 852

原创 血缘分析工具(一)之idea中使用antrl4插件和g4文件

1、idea安装antrl4的插件2、g4文件的下载和使用3、如成Visitor和Listener何生4、如何调试适配无法解析的sql

2024-03-18 11:12:24 672

原创 数据血缘分析思路

【代码】数据血缘分析思路。

2023-08-11 16:56:04 359 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除