借鉴:
https://www.163.com/dy/article/GVQ6DF8I0511DQI7.html
首先介绍一下什么是对象存储
对象存储是一种数据存储架构,允许您将大量非结构化数据存储在可扩展的对象结构中。它将数据存储为具有元数据和唯一标识符的对象,从而更容易访问该数据。
1.LakeFS
LakeFS 是一种开源数据环境工具,可让您管理基于对象存储的数据湖。这些数据湖是存储库,您可以在其中转储所有结构化和非结构化类型的数据。LakeFS 还集成了许多工具并支持 Amazon S3 和 Google Cloud Storage。此外,它适用于所有主要数据框架,例如 Hive、Spark、Presto、AWS Athena 等。
使用 LakeFS,您可以扩展 PB 级数据,还可以通过其类似于 Git 的分支和版本控制方法向其中添加数据,这使您可以在不破坏数据的情况下添加更新。这种类似于 Git 的方法还有助于轻松撤消数据更改,这使得处理数据更加容易和安全。
您还可以通过查看 LakeFS 文档了解其他特性和功能。
2.Ceph
Ceph 是对象存储、块存储和文件系统的开源平台。它提供与 Amazon 的 S3 REST API 和 OpenStack 的 API Swift 完全兼容的对象存储功能。
Ceph 的对象存储允许您使用本地语言绑定和 Ceph 提供的其他技术轻松访问数据对象。如果您想转变公司的 IT 基础架构及其管理大量非结构化数据的能力,这是一个很好的解决方案。他们还有一些软件库,使用 Java、C、C++、Python、PHP 和其他几个编写的软件能够使用原生 API 的强大功能访问 Ceph 的对象存储系统。
- MinIO
MinIO 是一款开源云存储软件,提供高性能分布式对象存储,专为大规模数据基础设施而设计。它与 Amazon S3 API 兼容,并且它在 GitHub 上拥有超过 26,000 颗星,有超过 680 名贡献者在为它工作。
MinIO 服务器存储所有类型的非结构化数据,例如照片、视频、日志文件等。它也可在开源 Apache V2 许可下使用,许多最强大的大数据和机器学习应用程序都使用 MinIO S3 对象存储。您可以在 MinIO 网站上查看许多其他功能。
4.OpenIO
OpenIO 是一种开源对象存储解决方案,用于管理和保护大量非结构化数据。它允许您构建和操作具有弹性且安全的大规模存储基础架构。
OpenIO 与 S3 兼容,可以在任何硬件上部署或云托管。添加新硬件时也不需要重新分配数据;您可以立即使用额外的容量。OpenIO 还专为大规模基础设施和大数据工作负载而设计。除此之外,它还提供了一个直观的用户界面来简化存储管理员的日常生活。因此,您的数据变得非常易于访问且易于管理。
5.Apache Ozone
Ozone是Hadoop的可扩展、冗余和分布式对象存储。除了可以扩展到数十亿个大小不等的物体之外,Ozone还可以在Kubernetes和YARN等容器环境中有效发挥作用。使用ApacheSpark、Thread和Hive等框架的应用程序在本地运行,无需任何修改。Ozone建立在一个名为Hadoop分布式数据存储(HDD)的高可用复制块存储层上。Ozone现在已经普遍可用(GA),版本为1.2.1。