开源项目介绍 |Apache Ozone-分布式大数据通用存储

2021腾讯犀牛鸟开源人才培养计划

开源项目介绍

滑至文末报名参与开源人才培养计划

提交项目Proposal

Apache Ozone项目介绍

              

标签:大数据存储 

技术栈:Java

标签:大数据存储 

技术栈:Java

Apache Ozone-分布式大数据通用存储,Ozone是一个大数据场景分布式存储,支持百亿到千亿级对象和文件。Ozone提供兼容S3 的对象功能,和兼容Hadoop File System(HCFS)的文件功能,同时通过CSI驱动接入Kubernets生态。Ozone定位于混合云场景存储支持,是面向数据湖的下一代大数据存储系统。

Apache Ozone导师介绍

陈怡、费辉、耿斌、赵明超

陈怡:Apache Ozone PMC Chair、Apache Hadoop PMC

费辉:Apache Ozone Committer, Apache Hadoop Committer

耿斌:Apache Ozone Committer

赵明超:Apache Ozone Committer

导师寄语:

“大数据存储是整个大数据系统的基石,Ozone是Hadoop生态推出的新一代大数据场景分布式存储,支持百亿到千亿级对象和文件。希望同学们通过暑期实践,对于大数据生态的存储能有一个深入的了解和掌握。”——陈怡

Apache Ozone拓展资料

????Apache Ozone官网

https://ozone.apche.org

????Apache Ozone最新发布1.1.0文档:https://ozone.apache.org/docs/1.1.0/

????TOzone:Native Object Store for Hadoop:

http://4nqiq.cn/5nXVg

Apache Ozone实战任务

(最终具体任务以实战阶段导师布置为准)

编程任务

项目:兼容S3协议的数据Lifecycle管理

任务:
1. 数据Lifecycle管理的设计
2. 在S3网关实现Lifecycle 策略的设置和修改
3. 在Ozone 命令行支持 LifeCycle的CRUD
4. 在Ozone元数据OM节点,实现Lifecycle的具体功能
5. 完成代码编写和测试,完成功能使用文档
6. Demo 演示

参考资料:
https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html  (复制链接粘贴至浏览器即可查看)

扫码填写问卷报名,提交项目proposal

加入开发实战

与导师一起成长这一夏

Apache Ozone开源项目交流群

欢迎对本项目感兴趣的同学一起交流

更多开源项目信息,

尽在“腾讯犀牛鸟开源人才社区”

扫码加入,解锁所有学习资料

关于腾讯犀牛鸟开源人才培养计划:为响应国家十四五规划的开源战略,腾讯于2021年5月发布“首届腾讯犀牛鸟开源人才培养计划”,希望企业界和教育界形成合力,打造面向高校学生的开源课程和开源实践培养方案,培育开源人才,普及开源文化,助力开源人才生态的发展。

首届项目由教育部计算机教学指导委员会、教育部软件工程教学指导委员会、中国信息通信研究院作为联合指导单位,包括开源基础培训、开源进阶研学、开源项目实战三个环节,项目涉及云原生、微服务、容器、AI、大数据、前端、物联网/边缘计算等多项技术热点。

各位同学报名即可参加线上开源系列课程,学习开源知识,对话学界及产业界大咖。其中入选开源项目实战的学生将在导师的一对一指导下,利用暑假开展编程实战,并有机会获得腾讯开源贡献者证书(目前全球只发出了10+张)。

????学生指南Q&A:https://github.com/Tencent/OpenSourceTalent/issues/14

????官方QQ群:859260607 (加群请备注学校+专业)

【其他项目介绍】

开源项目介绍 |TKEStack-开源容器服务平台

开源项目介绍 |OMI-前端【跨框架】框架

开源项目介绍 |APIJSON- 后端零代码接口和文档ORM 库

开源项目介绍 |TARS-高性能微服务治理框架

开源项目介绍|Apache InLong-分布式消息中间件系统

开源项目介绍|Tencent KonaJDK

开源项目介绍 |SuperEdge-云原生边缘计算平台

开源项目介绍 |Hippy-跨平台动态化框架

开源项目介绍 | Angel-高性能分布式机器学习平台

【申报指南】

申报指南|这才是报名&提交proposal的正确姿势

腾讯犀牛鸟开源人才培养计划官网

https://opensource.tencent.com/summer-of-code

(点击文末阅读原文直接访问)

合作或疑问欢迎联系:tencentopen@tencent.com

HustStore- 高性能分布式存储服务huststore 是一个高性能的分布式存储服务,不但提供了 10w QPS 级别的 kv 存储的功能,还提供了 hash、set 等一系列数据结构的支持,并且支持 二进制 的 kv 存储,可以完全取代 Redis 的功能。此外,huststore 还结合特有的 HA 模块实现了分布式消息队列的功能,包括消息的流式推送,以及消息的 发布-订阅 等功能,可以完全取代 RabbitMQ 的功能。特性huststore 分为 hustdb 以及 HA 模块两大部分。hustdb (存储引擎)的底层设计采用了自主开发的 fastdb,通过一套独特的 md5 db 将QPS 提升至 10w 级别的水准(含网络层的开销)。HA 以 nginx 模块的方式开发。nginx 是工业级的 http server 标准,得益于此,huststore 具备以下特性:高吞吐量hustdb 的网络层采用了开源的 libevhtp 来实现,结合自主研发的高性能 fastdb 存储引擎,性能测试 QPS 在 10w 以上。高并发参考 nginx 的并发能力。高可用性huststore 整体架构支持 Replication (master-master),支持 load balance 。HA 的可用性由nginx 的 master-worker 架构所保证。当某一个 worker 意外挂掉时, master 会自动再启动一个 worker 进程,而且多个 worker 之间是相互独立的,从而保证了 HA 的高可用性。huststore 的高可用性由其整体架构特点保证。由于 hustdb 的存储节点采用了 master-master 的结构,当某一个存储节点挂掉时,HA 会自动将请求打到另外一台 master,同时 HA 会按照自动进行负载均衡,将数据分布存储在多个 hustdb节点上,因此存储引擎不存在单点限制。同时 HA 集群本身也是分布式的设计,而且每个 HA 节点都是独立的,当某一台 HA 挂掉时, LVS 会自动将请求打到其他可用的 HA 节点,从而解决了 HA 得单点限制。通用性的接口huststore 使用 http 作为通用协议,因此客户端的实现不限制于语言。支持二进制的 key-value架构设计运维架构存储引擎设计依赖leveldblibcurllibevhtpzlog 标签:360  分布式存储
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值