IDEAL Garden

Thoughtworks思特沃克中国 CSDN认证博客专家

CSDN认证企业博客

459: 原创

3万+: 周排名

64万+: 总排名

43万+: 访问

: 等级

7503: 积分

739: 粉丝

159: 获赞

143: 评论

686: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何高效使用Gherkin
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/616963949?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
为什么企业要做大规模敏捷？
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614935126。
搜索与推荐那些事儿
秭慕: 引用「根据用户/物品/场景等信息，从候选物品的池子中选出与用户匹配的的物品列表。」言简意赅
中台与组织 | 白话中台战略
Aaron-Wu: 企业级能力复用平台既然投入大量人力物力来建设平台，终究不是为了复用而已吧
团队的Code Review实践
m0_57781768: 支持创作，支持好文，受益了

最新文章

大数据

关注

文章平均质量分 80

关注数：文章数：1 文章阅读量：156 文章收藏量：1

作者: Thoughtworks思特沃克中国

这个作者很懒，什么都没留下…

展开

分布式计算框架状态与容错的设计

本文以Hadoop、Spark、Flink为例，介绍分布式计算框架中状态与容错的设计思想。摘要对于一个分布式计算引擎（尤其是7*24小时不断运行的流处理系统）来说，由于机器故障、数据异常等原因导致作业失败的情况是时常发生的，因此一般的分布式计算引擎如Hadoop、Spark都会设计状态容错机制确保作业失败后能够恢复起来继续运行，而新一代的流处理系统Flink在这一点上更有着优秀而简约的设计。每个框架都有与之相关的诸多概念，常常令开发者感到困惑。本文会尽量避免从官方文档的角度进行论述，而是尝试先跳出具体

原创 2021-07-01 15:46:57 · 156 阅读 · 0 评论