- 博客(1)
- 资源 (12)
- 问答 (4)
- 收藏
- 关注
原创 深入剖析 Delta Lake: MySQL CDC 实战
前言在初建大数据平台时,我想大家都遇到过这样一个需求,mysql 的数据如何同步到 hdfs 中供数仓分析使用在早期,业务可能对实时性的要求还不高,大家的计算也都是 T+1 的离线计算,当然也可能有 H+1 的准实时计算。大家的选型可能是 sqoop、datax 等工具。此时只需要在离线调度平台上配置每天/每小时拉取 mysql 数据同步到 hive 的任务即可。但该方式也有一些弊端,如:实时性较差全量抽取、尤其是每小时一次的抽取对 mysql 的压力很大...
2020-11-06 17:45:12 1838 5
dubbo-admin-2.5.4
2017-12-18
Socket实例之客户端向服务端数据库上传文件UI版
2016-12-12
算法导论中文第二版
2015-07-18
一个算法问题 最长子串
2016-04-23
喜欢算法的来帮帮忙 这道题实在是不会了
2016-04-22
layoutparams设置宽度和高度填充父容器无效啊
2016-02-23
关于返回值的问题(图的遍历),求解答啊
2015-07-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人