揭秘京东文件系统JFS的前世今生，支持双11每秒约10万个对象同时读写

最新推荐文章于 2019-03-01 13:08:00 发布

csdn研发技术

最新推荐文章于 2019-03-01 13:08:00 发布

阅读量1.3w

点赞数 6

分类专栏：技术文章文章标签：文件系统京东双11

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dev_csdn/article/details/78612933

版权

背景

作为一家大规模的自营式电商企业，京东需要存储海量的非结构化数据：商品图片、订单文本、仓库流转记录、App客户端文件、日志文件、内部文档等。对于存储这些数据，之前并没有统一的解决方案，都是各个业务线自行解决——MySQL BLOB、HDFS、FastDFS。

2013年5月，京东开始组建存储组，自主研发JFS——京东文件系统，以实现非结构化数据存储统一服务为目标。

小文件存储

针对3个典型的应用场景——商品图片、OFC订单、WMS库房流水，JFS第一版定位为海量小文件存储，其核心功能定义如下。

海量小文件存储，极高的可靠性、可用性与一致性。
Key-File数据模型，Key由系统生成，全局唯一；文件immutable，即不可修改，甚至极少被删除。

其主要包含如下3个模块。

ZooKeeper作为集群协调器管理元数据信息。
由Go语言开发的DataNode，实现服务端读写逻辑、复制协议、故障恢复等。每个DataNode管理一块磁盘——该设计大幅简化了工程实现。
由Java开发的客户端。

复制协议实现了一种Paxos变体，或者说一种极简的Paxos实现，如图1所示：固定成员（一个复制组由1primary + 2follower构成）、固定角色（primary与follower角色不会发生变更）、固定读写流程（client将写操作发送到primary，它在写本地的同时将写操作发给两个follower，三副本都写入成功后才成功返回给用户；优先在follower上读取，提高系统的并发能力）。

存储引擎采用Append-Only方式，每个DataNode维护一组（默认配置为512）Chunk大文件，客户端上传的小文件（如一张图片）被并行追加至一个复制组三名成员对应的Chunk中，如图2所示。

最低0.47元/天解锁文章

csdn研发技术

关注

6
点赞
踩
11

收藏

觉得还不错? 一键收藏
6
评论
揭秘京东文件系统JFS的前世今生，支持双11每秒约10万个对象同时读写

背景作为一家大规模的自营式电商企业，京东需要存储海量的非结构化数据：商品图片、订单文本、仓库流转记录、App客户端文件、日志文件、内部文档等。对于存储这些数据，之前并没有统一的解决方案，都是各个业务线自行解决——MySQL BLOB、HDFS、FastDFS。2013年5月，京东开始组建存储组，自主研发JFS——京东文件系统，以实现非结构化数据存储统一服务为目标。小文件存储针对3个典型的应用场景——
复制链接

扫一扫

专栏目录

csdn研发技术 CSDN认证博客专家 CSDN认证企业博客

码龄7年

90: 原创

30万+: 周排名

192万+: 总排名

193万+: 访问

: 等级

1万+: 积分

1380: 粉丝

773: 获赞

496: 评论

1157: 收藏

私信

关注

热门文章

分类专栏

技术文章 46篇
技术翻译 95篇
人物专访 4篇
大会 10篇

最新评论

程序员这个职业会是另一个即将破裂的泡沫？
frostjsy: 后面可能对理论知识要求、经验要求更高了吧
从开发小白到音视频专家
do ｛｝while；: 小老哥，我也刚入职你能不能不吝指导我一下
世界上第一个时序数据的Middle-Out算法压缩
lyh20021209: Big Head!
从开发小白到音视频专家
永存的大大咧咧: 我看这篇文章发的比较早，而恰巧近期参加七牛云的“一站式场景化智能视频云”的相关技术分享活动。所以在博主的楼下进行一些内容的补充和最新发展方向的探讨。 1. 成长的烦恼：在过去，我们可能更纠结的是使用什么语言，因为不同语言和系统的贴合程度是有缺别的；后来，不再局限于语言，因为大部分语言都实现了跨平台，所以我们更纠结的是如何基于平台的api做应用开发；而现在，我们更注重如何利用这些API开发一些「模组」，开发者可以利用这些「模组」，通过配置就可以实现一些功能，也是七牛现在着重在做的低代码音视频平台（low code）；而未来可能就真的是拖拉拽完成功能的开发。 2. 音视频开发包括哪些内容作者从「采集」->「渲染」->「处理」->「传输」介绍了主要的音视频方案。「采集」可能最开始的注重设备的参数（分辨率、帧率等），到现在随着iot采集设备的发展，可能更注重的是安全，这里面涉及一些边缘设备的通信协议以及加密算法。「渲染」一直是重中之重，加之近1年元宇宙的概念，又给渲染带来了无尽的难题，对于3D虚拟场景与现实场景的结合渲染技术可能是主要需要研究的方向。「处理」除了音频降噪，图片缩放等基础变化，对于音视频的处理可能更加的需要结合AI能力和场景，比如美颜，虚拟背景，会议实时字幕等等。「传输」17年没有5G吧，随着速率的提升我们的需求可能也在不断的变得苛刻，比如高清直播与实时互动。这里我还想补充的是「存储」，可能以前不会太过考虑这个问题，可能视频真的没有想象中那么多，虽然17年抖音已经非常火了，但是现在任何一个软件打开的视频流，以及我们随时随地的线上会议，还有各种各样的摄像头，让我们不得不重视起来存储，现在更重要的是肉眼画质不变的情况下，使图像体积变小，然后存储（七牛的kodo应该就可以）。最后谈一下“一站式”，对于音视频从采集、渲染、处理、到传输和存储，一站式的解决方案显得尤为重要，另外一站式就需要针对不同的场景去做智能化开发，这可能就是七牛「一站式场景化智能视频云」的真谛吧。
IDHub创始人曲明：数字身份将是下一个万亿市场
张京生 jim: 数字身份，万亿市场？不理解！

大家在看

Jetpack Compose学习记录（一） 403

最新文章

目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。