学习笔记

最新推荐文章于 2024-08-13 09:11:34 发布

wyyl1

最新推荐文章于 2024-08-13 09:11:34 发布

阅读量335

点赞数

分类专栏：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wyyl1/article/details/52491823

版权

学习笔记专栏收录该内容

57 篇文章 2 订阅

订阅专栏

Kafka深度解析

高并发系统数据幂等

摘要
在系统开发过程中，经常遇到数据重复插入、重复更新、消息重发发送等等问题，因为应用系统的复杂逻辑以及网络交互存在的不确定性，会导致这一重复现象，但是有些逻辑是需要有幂等特性的，否则造成的后果会比较严重，例如订单重复创建，这时候带来的问题可是非同一般啊。
什么是系统的幂等性
幂等是数据中得一个概念，表示N次变换和1次变换的结果相同。
幂等性接口的不足
1、增加了额外控制幂等的业务逻辑，复杂化了业务功能；
2、把并行执行的功能改为串行执行，降低了执行效率。
因此除了业务上的特殊要求外，尽量不提供幂等的接口。
http://www.jb51.net/article/90010.htm
http://marvinsworld.cn/2016/06/02/idempotent-solutions/
2016-09-11

Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremel

摘要
Dremel可在大约3秒钟时间里处理1PB的数据查询请求
发表于2012-08-20 16:39
http://www.csdn.net/article/2012-08-20/2808870
2016-09-10
2016-09-23补充
记录内聚合
由于Demel支持List的数据类型，有的时候，我们需要计算每个记录里面的各个List的聚合。如
Q4 : SELECT COUNT(c1 > c2) FROM (SELECT SUM(a.b.c.d) WITHIN RECORD AS c1, SUM(a.b.p.q.r) WITHIN RECORD AS c2 FROM T3)
我们需要count所有sum(a.b.c.d)比sum(a.b.p.q.r)，执行这条语句实际只需要扫描13GB的数据，耗时15s，而整张表有70TB。如果没有这样的嵌套数据结构，这样的查询会很复杂。
为了帮助企业用户寻找更为有效、加快Hadoop数据查询的方法，Apache 软件基金会发起了一项名为“Drill”的开源项目。Apache Drill 实现了 Google’s Dremel.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。