Minio是一款分布式对象存储软件,使用比较广泛。这篇文章介绍Minio的安装,这是一个准生产环境的安装,如果是生产环境需要考虑日后的扩容和高可用保证。
- 实验环境
操作系统:CentOS Linux release 7.9.2009 (Core)
Minio版本:
minio version RELEASE.2024-04-06T05-26-02Z (commit-id=9d63bb1b418f6c1bbcc8434fff5d8aba810ee5d7)
Runtime: go1.21.9 linux/amd64
License: GNU AGPLv3 <https://www.gnu.org/licenses/agpl-3.0.html>
Copyright: 2015-2024 MinIO, Inc.
集群配置:单节点配置四块硬盘
- 前期准备
升级内核:CentOS 7.9默认是3.10版本的内核,按官方建议升级到4.0及以上。
包含序号的主机名:minio1.example.cn,这个主要为后面扩容方便。
时间同步:生产环境minio多节点部署,需要时间同步,可以安装ntpd并配置国内时间服务器。
硬盘配置:服务器挂载四块硬盘,并格式化为XFS文件系统,格式化时配置label。
其他三块硬盘使用相同命令格式化,label分别为“minio12,minio13,minio14”。
配置/etc/fstab,并执行命令“mount -a”挂载全部硬盘
- 安装与配置
从minio官网下载minio.rpm文件,使用rpm -i minio.rpm命令安装,这是官方推荐的minio安装方式,它会自动创建minio的 Systemd Unit文件,这样可以通过systemd来管理服务的启停。启动前创建环境变量文件,
/etc/default/minio
MINIO_VOLUMES="http://minio1.example.cn:9000/mnt/disk{1...4}/minio"
MINIO_OPTS="--console-address :9001"
MINIO_ROOT_USER=minioadmin
MINIO_ROOT_PASSWORD=minioadminWo3
MINIO_SERVER_URL="http://minio1.example.cn:9000"
因为minio Unit文件使用minio-user用户管理minio服务,所以需要创建minio-user系统用户
useradd minio-user
修改后端存储的目录所有者为minio-user
chown -R minio-user:minio-user /mnt
使用下面命令启动服务并配置开机自启
systemctl start minio
systemctl enable minio
此时使用浏览器访问“
http://minio1.example.cn:9001”,即可访问minio的Web管理界面。
- mc安装与集群访问
mc是minio的命令行管理工具,因为也是使用Golang编写,直接官网下载放到$PATH环境变量包含的目录并赋予可执行权限便可使用,添加访问Alias,
mc alias set mm http://minio1.example.cn:9000 minioadmin minioadminWo3
配置按照下面格式即可,
mc alias set ALIAS URL ACCESSKEY SECRETKEY
mc的帮助文档很全面,有任何疑问可以使用"mc -h"这样的格式查询文档,“-h”放在末尾。
- 高可用原理
使用上面配置好的mc命令查看集群状态,显示如下,
可知minio集群有一个服务器池(Pool),一个纠删集(Erasure sets),其中包含四块硬盘。minio使用了纠删码(Erasure Coding)来提高数据的冗余性和可靠性,上面纠删集大小是4(因为是四块硬盘),这四块硬盘有一部分用来存储对象的真实数据,有一部分用来存储对象的校验数据(Parity),根据minio的默认设置(STANDARD storage class)如下,
四块硬盘将有两块用来存储对象真实数据,其他两块用来存储校验数据。使用的底层空间是实际数据的两倍。下面这幅图可以看出文件系统确实被占用了实际数据的两倍,
优点是损失任意两块(不管是数据盘还是校验盘)硬盘不影响数据的只读,损失一块不影响数据的读写。可以手动umount掉两块硬盘,验证这个理论,
模拟硬盘故障,umount掉两块硬盘后,数据仍然可以正常读取,但是已经不能写入了,
这里使用的默认奇偶校验(Default Parity)为EC:2,因为总共只有四块硬盘,已经达到最大的EC:N,其中N为存放校验数据的硬盘块数,minio为了防止裂脑,限制了写入操作,但读取不受影响。
- 总结
生产环境要规划好服务器的个数和每台服务器硬盘的个数,最大限度保证数据的高可用也方便后续的空间扩容。
希望这篇文章能帮助到你!