MinIO学习笔记

视频学习地址

MinIO简介

MINIO干什么用的: AI数据基础设施的对象存储

在这里插入图片描述

  • 为人工智能系统提供数据支持,数据存储
  • 对象存储(Object Storage)是一种数据存储架构,它以对象为单位来处理、存储和检索数据,每个对象都包含了数据本身以及元数据
  • MinIO存储的元数据主要包括对象的描述信息,如用户(account)、存储桶(bucket)以及存储桶索引(bucket index)等;
  • 对象存储系统通常通过基于HTTP或HTTPS协议的API(应用程序编程接口)进行数据读写;

MINIO是使用go语言进行开发的。

MinIO具有双重许可:

  • 开源GNU AGPL v3;(完全免费)
  • 商业企业许可证;(收费)

在下载的时候就可以选择免费的AGPL许可。

在这里插入图片描述

MINIO的下载(LINUX版本):

wget https://dl.min.io/server/minio/release/linux-amd64/minio #下载
chmod +x minio #赋予可执行权限
MINIO_ROOT_USER=admin MINIO_ROOT_PASSWORD=password ./minio server /mnt/data --console-address ":9001"  #MINIO服务启动
  • MINIO_ROOT_USER:指定MinIO的用户名;
  • MINIO_ROOT_PASSWORD:指定MinIO的密码;
  • /mnt/data:指定MinIO服务器用于存储数据的目录;
  • console-address ":9001" :指定MinIO控制台的监听地址和端口

使用Docker启动运行MinIO

  • 拉取镜像
docker pull minio/minio
  • 启动MinIO容器:
docker run -p 9000:9000 -p 9001:9001 minio/minio server /mnt/docker/data --console-address :9001

Springboot整合Minio

  1. 导入依赖
        <dependency>
            <groupId>io.minio</groupId>
            <artifactId>minio</artifactId>
            <version>8.2.1</version>
        </dependency>
  1. 编写config配置类
package com.example.springboot_demo.config;

import io.minio.MinioClient;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class MinIOConfig {
    @Bean
    public MinioClient minioClient(){
        return MinioClient.builder()
                .endpoint("http://192.168.114.128:9000")
                .credentials("minioadmin","minioadmin").build();
    }
}

  1. 编写service
package com.example.springboot_demo.service;

import io.minio.MinioClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.context.annotation.Configuration;
import org.springframework.stereotype.Service;

@Service
public class MinIOService {
    @Autowired
    private MinioClient minioClient;

    public void testMinioClient(){
        System.out.println(minioClient);
    }
}

  1. 写测试代码
package com.example.springboot_demo;

import com.example.springboot_demo.service.MinIOService;
import org.junit.jupiter.api.Test;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;

@SpringBootTest
class SpringbootDemoApplicationTests {

    @Autowired
    MinIOService minIOService;

    @Test
    void contextLoads() {
        minIOService.testMinioClient();
    }

}

  1. 控制台输出
    在这里插入图片描述

过程中可能碰到的问题看这


MinIO中的Bucket、Object

  • Bucket是存储Object的逻辑空间,每个Bucket之间的数据是相互隔离的,对用户而言,相当于存放文件的顶层文件夹;
  • Object是存储到MinIO的基本对象,对用户而言,相当于文件;

MinIO是线程安全的

MinioClient的常用API:操作bucket

  • bucketExists()
    用于检查指定的存储桶是否存在,返回布尔值,表示存储桶是否存在;
    @Autowired
    private MinioClient minioClient;

    @Test
    void test01() throws Exception {
        boolean isBuketExists = minioClient.bucketExists(BucketExistsArgs.builder().bucket("myfile").build());
        //判断myfile bucket是否存在
        System.out.println(isBuketExists);
    }
  • makeBucket()
    用于创建一个新的存储桶(bucket),需要指定存储桶的名称;
    @Autowired
    private MinioClient minioClient;

    @Test
    void  test02() throws Exception{
    //创建一个myfile的bucket
        minioClient.makeBucket(MakeBucketArgs.builder().bucket("myfile").build());
    }

登录http://ip地址:9001可以看到新添加的myfile
在这里插入图片描述

  • listBuckets()
    用于列出用户有权访问的所有存储桶,返回存储桶的列表;
    @Autowired
    private MinioClient minioClient;

    @Test
    void  test03() throws Exception{
        List<Bucket> bucketList = minioClient.listBuckets();
        bucketList.forEach(bucket -> {
            System.out.println(bucket.name()+"--"+bucket.creationDate());
        });
    }
  • removeBucket()
    用于删除一个已存在的存储桶(bucket),删除失败会抛出异常;
    @Autowired
    private MinioClient minioClient;

    @Test
    void  test04() throws Exception{
        minioClient.removeBucket(RemoveBucketArgs.builder().bucket("myfile").build());
    }

MinioClient的常用API:操作对象

  • putObject()
    用于上传文件到指定的存储桶;
    @Autowired
    private MinioClient minioClient;

    @Test
    void  test06() throws Exception{
        File file = new File("F:\\pic.jpg");
        minioClient.putObject(PutObjectArgs.builder()
                .bucket("myfile")
                .object("test.jpg")
                .stream(new FileInputStream(file),file.length(),-1)
                .build());
        //bucket("myfile"):存到哪个bucket
        //object("test.jpg):存储的名字
        //stream(new FileInputStream(file),file.length(),-1)
        //Few FileInputStream(file):输入流
        //file.length():输入流的长度
        //-1:开启缓冲区的大小,-1表示系统自己设定缓冲区大小
    }
  • statObject()
    用于检查指定的对象(文件)的状态;
    @Autowired
    private MinioClient minioClient;

    @Test
    void  test07() throws Exception{
        StatObjectResponse statObjectResponse = minioClient.statObject(StatObjectArgs.builder()
                .bucket("myfile")
                .object("test.jpg")
                .build());
        System.out.println(statObjectResponse);
    }
  • getPresignedObjectUrl()
    用于生成一个对象(文件)的签名URL,以便可以通过HTTP访问;
    @Test
    void  test08() throws Exception{
        String objectUrl = minioClient.getPresignedObjectUrl(GetPresignedObjectUrlArgs.builder()
                .bucket("myfile")
                .object("test.jpg")
                .method(Method.GET)
                .build());
        System.out.println(objectUrl);
    }

输出:
192.168.114.129:9000/myfile/test.jpg?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-A……
若想通过192.168.114.129:9000/myfile/test.jpg访问文件,需要修改权限
.
方式一:在web管理后台修改;(访问策略修改为 public)
bucket->myfile->Summary->Access Policy->public
在这里插入图片描述
方式二:通过客户端API修改;

   @Test
   void  test02() throws Exception{
       minioClient.makeBucket(MakeBucketArgs.builder().bucket("myfile").build());
       String policyJsonString = " \"{\"Version\":\"2012-10-17\",\"Statement\\\":[{\\\"Sid\\\":\\\"PublicRead\\\",\\\"Effect\\\":\\\"Allow\\\",\\\"Principal\\\":{\\\"AWS\\\":\\\"*\\\"},\\\"Action\\\":[\\\"s3:GetObject\\\"],\\\"Resource\\\":[\\\"arn:aws:s3:::\" + bucketName + \"/*\\\"]}]}\";";
       minioClient.setBucketPolicy(SetBucketPolicyArgs.builder()
               .bucket("myfile")
               .config(policyJsonString)
               .build());
   }
  • getObject()
    用于从指定的存储桶中下载文件;
    @Test
    void  test09() throws Exception{
        GetObjectResponse getObjectResponse = minioClient.getObject(GetObjectArgs.builder()
                .bucket("myfile")
                .object("test.jpg")
                .build());
    }
  • listObjects()
    用于列出指定存储桶中的所有对象(文件);
    @Test
    void  test010() throws Exception{
        Iterable<Result<Item>> listObjects = minioClient.listObjects(ListObjectsArgs.builder()
                .bucket("myfile")
                .build());
        listObjects.forEach(itemResult->{
            try {
                Item item = itemResult.get();
                System.out.println(item.objectName());
            } catch (Exception e) {
                e.printStackTrace();
            }
        });
    }
  • removeObject()
    用于删除指定存储桶中的对象,需要指定存储桶名称和对象键;
    @Test
    void  test011() throws Exception{
        minioClient.removeObject(RemoveObjectArgs.builder()
                .bucket("myfile")
                .object("test.jpg")
                .build());
    }

MinIO集群部署

纠删码模式部署

  • 纠删码(Erasure Code)简称EC,是一种数据保护方法,也是一种算法;
  • MinIO对纠删码模式的算法进行了实现,采用Reed-Solomon code(简称RScode)纠错码将对象拆分成N/2数据和N/2奇偶校验块,Reed Solomon利用范德蒙矩阵(Vandermonde matrix)、柯西矩阵(Cauchy matrix)的特性来实现;
  • 将数据拆分为多个数据块和多个校验块,分散存储在不同的磁盘上,即使在部分磁盘损坏或丢失的情况下,也可以通过剩余的数据块和校验块恢复出原始数据
    • 举个例子,现在有12块磁盘,一个对象数据会被分成6个数据块、6个奇偶校验块,你可以损坏或丢失任意6块磁盘(不管其是存放的数据块还是奇偶校验块),仍可以从剩下的磁盘中恢复数据。

单机多磁盘的纠删码模式部署

  • 执行命令:lsblk
    lsblk是Linux中的一个命令,用于列出所有可用的块设备(数据存储设备,如硬盘、闪存驱动器)的信息,如设备名称、大小、挂载点等;
  • 添加一块磁盘(通过虚拟机VM进行添加);
  • 输入命令,将添加的磁盘格式化为xfs格式:mkfs.xfs /dev/sdb
  • 输入命令,将磁盘挂载到minio的存储目录:mount /dev/sdb /opt/minio/data
  • 再查看一下:lsblk
  • 启动纠删码模式:/usr/local/minio/minio server --console-address ":9001" /opt/minio/data/data{1...12}

后台启动纠删码模式命令:
nohup /usr/local/minio/minio server --console-address ":9001" /opt/minio/data/data{1...12} > /opt/minio/data/minio.log 2>&1 &

  • nohup:
    这是一个Unix命令,用于运行另一个命令在后台,并且忽略挂起(HUP)信号,也就是即使你退出了终端或关闭了会话,该命令也会继续运行;
  • > /opt/minio/data/minio.log:
    这部分是将标准输出(stdout)重定向到 /opt/minio/data/minio.log 文件,这意味着 MinIO 服务器的所有正常输出(如启动信息、状态更新等)都会被写入到这个日志文件中;
  • 2>&1: 这部分是将标准错误输出(stderr)重定向到标准输出(stdout),即输出到 /opt/minio/data/minio.log 文件,这样,无论是标准输出还是错误输出,都会被写入到同一个日志文件中;
  • &: 这个符号是在命令的末尾,用于将命令放到后台执行,也就是即使你启动了 MinIO 服务器,你的终端或 shell 会话也不会被阻塞,你可以继续执行其他命令;

分布式集群部署

单机多磁盘的纠删码模式问题:
如果这台机器宕机了,那么minio就不能对外提供服务了;

MinIO集群搭建步骤:(多节点多磁盘)

  • 准备4台机器;(根据MinIO的架构设计,至少需要4个节点来构建集群,这是因为在一个N节点的分布式MinIO集群中,只要有N/2节点在线,数据就是安全的,同时,为了确保能够创建新的对象,需要至少有N/2+1个节点,因此,对于一个4节点的集群,即使有两个节点宕机,集群仍然是可读的,但需要有3个节点才能写数据;)
  • 每台机器添加一块磁盘;(minio集群需要独占磁盘块,不能使用Linux的root磁盘块)
  • 将添加的磁盘格式化为xfs格式:mkfs.xfs /dev/sdb
  • 将磁盘挂载到minio的存储目录:mount /dev/sdb /opt/minio/data
  • 每台机器上安装好minio;(我们这里是安装在 /usr/local/minio 目录下,版本统一)
  • 关闭防火墙systemctl stop firewalld
  • 进入到cd /opt/minio/文件夹下,创建磁盘文件mkdir data1 data2 data3 data4
  • 创建执行脚本vim start.sh,输入:
#!/bin/bash
export MINIO_ROOT_USER=minioadmin
export MINIO_ROOT_PASSWORD=minioadmin
/usr/local/minio/minio server --config-dir /etc/minio --address :9000 --console-address :9001 \
http://192.168.11.128/opt/minio/data/data1 http://192.168.11.128/opt/minio/data/data2 \
http://192.168.11.128/opt/minio/data/data3 http://192.168.11.128/opt/minio/data/data4 \
http://192.168.11.129/opt/minio/data/data1 http://192.168.11.129/opt/minio/data/data2 \
http://192.168.11.129/opt/minio/data/data3 http://192.168.11.129/opt/minio/data/data4 \
http://192.168.11.130/opt/minio/data/data1 http://192.168.11.130/opt/minio/data/data2 \
http://192.168.11.130/opt/minio/data/data3 http://192.168.11.130/opt/minio/data/data4 \
http://192.168.11.131/opt/minio/data/data1 http://192.168.11.131/opt/minio/data/data2 \
http://192.168.11.131/opt/minio/data/data3 http://192.168.11.131/opt/minio/data/data4 &

上面脚本,创建了4个节点,每个节点有4个磁盘块

  • 给脚本赋权限:chmod 744 start.sh
  • 执行脚本:./start.sh

执行好上诉步骤,我们搭建了包含4个节点16个磁盘的分布式集群。接下来,需要搭建一个Nginx服务器,用于负载均衡。外界通过访问Nginx服务器来获取对象。
在这里插入图片描述


Nginx

Nginx服务器

  • Nginx 是一个高性能的web服务器;(服务器)
  • Nginx 是俄罗斯人Igor Sysoev用C语言开发的,第一个版本0.1.0发布于2004年10月4日;

安装步骤:(在某一个节点上进行即可,假设在ip地址为X.X.X.X的主机上进行配置)

  • Nginx的安装需要Linux安装相关的几个库,否则配置和编译会出现错误;
    yum install gcc openssl openssl-devel pcre pcre-devel zlib zlib-devel -y

  • Nginx服务器正式安装:

    • 解压下载下来的nginx文件,执行命令:tar -zxvf nginx-1.24.0.tar.gz
    • 切换至解压后的nginx主目录,执行命令:cd nginx-1.24.0
    • 在nginx主目录nginx-1.24.0下执行命令:./configure --prefix=/usr/local/nginx
      (其中–prefix是指定nginx安装路径)
    • 执行命令进行编译:make
    • 执行命令进行安装:make install
  • Nginx启动

    • 启动nginx执行命令:/usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
      (其中-c是指定配置文件)
    • 检查Nginx是否启动:通过查看进程:ps -ef | grep nginx
    • Nginx重启
      /usr/local/nginx/sbin/nginx -s reload
  • Nginx关闭

    • 优雅关闭Nginx:
      找出nginx的进程号:ps -ef | grep nginx
      执行命令:kill -QUIT 主pid
      其中pid是主进程号的pid(master process),其他为子进程pid(worker process)
      优雅关闭会将已经进来的请求处理完后再关闭;
    • 快速关闭Nginx:
      找出nginx的进程号:ps -ef | grep nginx
      执行命令:kill -TERM 主pid
      快速关闭会直接关闭,已经进来的请求也不会处理;(暴力方式)
  • Nginx配置检查
    当修改Nginx配置文件后,可以使用Nginx命令进行配置文件语法检查,用于检查Nginx的配置文件conf/nginx.conf是否正确:
    /usr/local/nginx/sbin/nginx -c /usr/local/nginx/conf/nginx.conf -t

  • Nginx负载均衡

    • vim nginx.conf
    • 在http模块配置upstream:
upstream api { 
     	server  192.168.11.128:9000; 
      	server  192.168.11.129:9000;  
     	server  192.168.11.130:9000;  
      	server  192.168.11.131:9000;  
} 
upstream webui { 
     	server  192.168.11.128:9001; 
      	server  192.168.11.129:9001;  
     	server  192.168.11.130:9001;  
      	server  192.168.11.131:9001;  
} 
    • 在server模块里配置:
server{
	listen  80;
	server_name  localhost;
location /{
	#root html;
	#index index.html   index.html;
	proxy_set_header Host $http_host;
    proxy_set_header Server MinIO;
    proxy_set_header Accept-Ranges bytes;
	proxy_pass http://api;#这里的api对应upstream后面的名字
}
}
    • 另起server(即不在上面那个server里写了)
server{
	listen  5000;
	server_name  localhost;
location /{
	proxy_pass http://webui;#这里的webui对应upstream后面的名字
}
}

后面只需要访问http://X.X.X.X:80就可以访问minio的API了,可视化界面需要访问http://X.X.X.X:5000。默认情况下会采取轮询的方式来依次访问各个节点。

  • 20
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值