flink往mongo塞数据

星点xingdian

已于 2022-02-16 20:50:02 修改

阅读量641

点赞数

分类专栏： Flink 数据库文章标签： flink redis 缓存

于 2022-01-11 21:56:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xingdianp/article/details/122442478

版权

Flink 同时被 2 个专栏收录

31 篇文章 7 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

mongo里塞数据,存在这个热点缓存问题。
ip映射域名、有可能发http请求获取。这种是一对多。
直接在mongo查。这种是一对一.
spark streaming foreachpartition 几千/s;
以下是我的改造方案, 可以试试这套
flink任务1: mongo oplog —>hbase —>删redis缓存
flink任务2 : 消费主流查habse redis做缓存如果主流是日志数据还得加flink状态缓存

异步IO 一定程度上可以解决这种维表关联的问题但是数据量大了(高峰10w+/s)依然不行. 还是得靠flink状态兜底. 目前我也没发现什么好的解决方案. 我已经是异步IO + 线程池 + redis连接池了
用redis缓存问题就来了数据一致性怎么保证缓存多久,穿透,雪崩怎么解决?
删缓存是因为更新habse 同时删缓存 ,为了一致性;
维表写hbase的同时，写redis行。然后加个try catch。加锁事务能保证;
但是工程上一般不会去更新redis 代价比较大, 删比较方便
何况oplog 给的数据其实是不全只有更新的字段;
更新的话你就得先读然后修改然后再put到redis里,相同key先删在insert;
细节上这种类似问题挺多的还有维表更新乱序
回刷数据导致维度取最新等等. 解决下去永远没个头

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。