Minio
支持大量视频,文件类存储。
小项目,不是特别重要的,可以选择云计算厂家,但是类似私密文件,用户的私密信息不适合放在云计算厂家里。收费的!存储和访问都要花钱!因此采用minio。功能强大,使用简单~
分布式文件系统
要理解分布式文件系统首先了解什么是文件系统。
文件系统是方便对磁盘上的文件进行管理的一种系统。把若干计算机通过网络连接起来,共同提供存储和访问的服务。
查阅百度百科:
文件系统是负责管理和存储文件的系统软件,操作系统通过文件系统提供的接口去存取文件,用户通过操作系统访问磁盘上的文件。
下图指示了文件系统所处的位置:
常见的文件系统:FAT16/FAT32、NTFS、HFS、UFS、APFS、XFS、Ext4等 。
独立部署的方式就叫分布式方式。
文件系统分布式:
现在有个问题,一此短视频平台拥有大量的视频、图片,这些视频文件、图片文件该如何存储呢?如何存储可以满足互联网上海量用户的浏览。
今天讲的分布式文件系统就是海量用户查阅海量文件的方案。
我们阅读百度百科去理解分布式文件系统的定义:
通过概念可以简单理解为:一个计算机无法存储海量的文件,通过网络将若干计算机组织起来共同去存储海量的文件,去接收海量用户的请求,这些组织起来的计算机通过网络进行通信,如下图:
好处:
1、一台计算机的文件系统处理能力扩充到多台计算机同时处理。
2、一台计算机挂了还有另外副本计算机提供数据。
3、每台计算机可以放在不同的地域,这样用户就可以就近访问,提高访问速度。
市面上有哪些分布式文件系统的产品呢?
1、NFS
阅读百度百科:
特点:
1)在客户端上映射NFS服务器的驱动器。
2)客户端通过网络访问NFS服务器的硬盘完全透明。
2、GFS
1)GFS采用主从结构,一个GFS集群由一个master和大量的chunkserver组成。
2)master存储了数据文件的元数据,一个文件被分成了若干块存储在多个chunkserver中。
3)用户从master中获取数据元信息,向chunkserver存储数据。
3、HDFS
HDFS,是Hadoop Distributed File System的简称,是Hadoop抽象文件系统的一种实现。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。 HDFS的文件分布在集群机器上,同时提供副本进行容错及可靠性保证。例如客户端写入读取文件的直接操作都是分布在集群各个机器上的,没有单点性能压力。
下图是HDFS的架构图:
1)HDFS采用主从结构,一个HDFS集群由一个名称结点和若干数据结点组成。
-
名称结点存储数据的元信息,一个完整的数据文件分成若干块存储在数据结点。
3)客户端从名称结点获取数据的元信息及数据分块的信息,得到信息客户端即可从数据块来存取数据。
4、云计算厂家(现成的)
阿里云对象存储服务(Object Storage Service,简称 OSS),是阿里云提供的海量、安全、低成本、高可靠的云存储服务。其数据设计持久性不低于 99.9999999999%(12 个 9),服务设计可用性(或业务连续性)不低于 99.995%。
官方网站:对象存储 OSS_云存储服务_企业数据管理_存储-阿里云
百度对象存储BOS提供稳定、安全、高效、高可扩展的云存储服务。您可以将任意数量和形式的非结构化数据存入BOS,并对数据进行管理和处理。BOS支持标准、低频、冷和归档存储等多种存储类型,满足多场景的存储需求。
官方网站:对象存储BOS_云存储_分布式存储_数据湖存储-百度智能云
MinIO
本项目采用MinIO构建分布式文件系统,MinIO 是一个非常轻量的服务,可以很简单的和其他应用的结合使用,它兼容亚马逊 S3 云存储服务接口,非常适合于存储大容量非结构化的数据,例如图片、视频、日志文件、备份数据和容器/虚拟机镜像等。
它一大特点就是轻量,使用简单,功能强大,支持各种平台,单个文件最大5TB,兼容 Amazon S3接口,提供了 Java、Python、GO等多版本SDK支持。
中文:MinIO | 高性能分布式存储,私有云存储,MinIO Object Storage for Kubernetes — MinIO Object Storage for Kubernetes
MinIO集群采用去中心化共享架构,每个结点是对等关系,通过Nginx可对MinIO进行负载均衡访问。
1.去中心化有什么好处?
-
容错性更强。
-
不会影响服务访问
-
挂掉机器启动之后可以迅速恢复
在大数据领域,通常的设计理念都是无中心和分布式。Minio分布式模式可以帮助你搭建一个高可用的对象存储服务,你可以使用这些存储设备,而不用考虑其真实物理位置。
它将分布在不同服务器上的多块硬盘组成一个对象存储服务。由于硬盘分布在不同的节点上,分布式Minio避免了单点故障。如下图:
纠删码技术:
Minio使用纠删码技术来保护数据,它是一种恢复丢失和损坏数据的数学算法,它将数据分块冗余的分散存储在各各节点的磁盘上,所有的可用磁盘组成一个集合,上图由8块硬盘组成一个集合,当上传一个文件时会通过纠删码算法计算对文件进行分块存储,除了将文件本身分成4个数据块,还会生成4个校验块,数据块和校验块会分散的存储在这8块硬盘上。
校验块:用于文件丢失之后的恢复。数据块:数据。
只要挂掉的结点不超过一半,就可以正常使用。
使用纠删码的好处是即便丢失一半数量(N/2)的硬盘,仍然可以恢复数据。 比如上边集合中有4个以内的硬盘损害仍可保证数据恢复,不影响上传和下载,如果多于一半的硬盘坏了则无法恢复。
2.数据恢复演示
下边在本机演示MinIO恢复数据的过程,在本地创建4个目录表示4个硬盘。
下载minio,下载地址在https://dl.min.io/server/minio/release/,可从课程资料找到MinIO的安装文件minio.zip解压即可使用,CMD进入有minio.exe的目录,运行下边的命令:
Plain Text minio.exe server D:\develop\minio_data\data1 D:\develop\minio_data\data2 D:\develop\minio_data\data3 D:\develop\minio_data\data4
启动结果如下:
说明如下:
SQL WARNING: MINIO_ACCESS_KEY and MINIO_SECRET_KEY are deprecated. Please use MINIO_ROOT_USER and MINIO_ROOT_PASSWORD Formatting 1st pool, 1 set(s), 4 drives per set. WARNING: Host local has more than 2 drives of set. A host failure will result in data becoming unavailable. WARNING: Detected default credentials 'minioadmin:minioadmin', we recommend that you change these values with 'MINIO_ROOT_USER' and 'MINIO_ROOT_PASSWORD' environment variables
1)老版本使用的MINIO_ACCESS_KEY 和 MINIO_SECRET_KEY不推荐使用,推荐使用MINIO_ROOT_USER 和MINIO_ROOT_PASSWORD设置账号和密码。
2)pool即minio节点组成的池子,当前有一个pool和4个硬盘组成的set集合
3)因为集合是4个硬盘,大于2的硬盘损坏数据将无法恢复。
4)账号和密码默认为minioadmin、minioadmin,可以在环境变量中设置通过'MINIO_ROOT_USER' and 'MINIO_ROOT_PASSWORD' 进行设置。
下边输入http://localhost:9000进行登录,账号和密码为:minioadmin/minioadmin
登录成功:
下一步创建bucket,桶,它相当于存储文件的目录,可以创建若干的桶。
输入bucket的名称,点击“CreateBucket”,创建成功
点击“upload”上传文件。
下边上传几个文件
下边去四个目录观察文件的存储情况
我们发现上传的1.mp4文件存储在了四个目录,即四个硬盘上。
下边测试minio的数据恢复过程:
1、首先删除一个目录。
删除目录后仍然可以在web控制台上传文件和下载文件。
稍等片刻删除的目录自动恢复。
2、删除两个目录。
删除两个目录也会自动恢复。
3、删除三个目录 。
由于 集合中共有4块硬盘,有大于一半的硬盘损坏数据无法恢复。
此时报错:We encountered an internal error, please try again. (Read failed. Insufficient number of drives online)在线驱动器数量不足.
3.测试Docker环境
开发阶段和生产阶段统一使用Docker下的MINIO。
在下发的虚拟机中已安装了MinIO的镜像和容器,执行sh /data/soft /restart.sh启动Docker下的MinIO
启动完成登录MinIO查看是否正常。
访问http://192.168.101.65:9000(这部分是自己配置的虚拟机的地址)
本项目创建两个buckets:
mediafiles: 普通文件
video:视频文件
4.SDK
上传文件
MinIO提供多个语言版本SDK的支持,下边找到java版本的文档:
地址:Java Quickstart Guide — MinIO Object Storage for Linux
最低需求Java 1.8或更高版本:
<dependency> <groupId>io.minio</groupId> <artifactId>minio</artifactId> <version>8.4.3</version> </dependency> <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okhttp</artifactId> <version>4.8.1</version> </dependency>
在media-service工程添加此依赖。
参数说明:
需要三个参数才能连接到minio服务。
参数 | 说明 |
Endpoint | 对象存储服务的URL |
Access Key | Access key就像用户ID,可以唯一标识你的账户。 |
Secret Key | Secret key是你账户的密码。 |
官方的示例代码如下:
import io.minio.BucketExistsArgs; import io.minio.MakeBucketArgs; import io.minio.MinioClient; import io.minio.UploadObjectArgs; import io.minio.errors.MinioException; import java.io.IOException; import java.security.InvalidKeyException; import java.security.NoSuchAlgorithmException; public class FileUploader { public static void main(String[] args)throws IOException, NoSuchAlgorithmException, InvalidKeyException { try { // Create a minioClient with the MinIO server playground, its access key and secret key. MinioClient minioClient = MinioClient.builder() .endpoint("https://play.min.io") .credentials("Q3AM3UQ867SPQQA43P2F", "zuf+tfteSlswRu7BJ86wekitnifILbZam1KYY3TG") .build(); // Make 'asiatrip' bucket if not exist. boolean found = minioClient.bucketExists(BucketExistsArgs.builder().bucket("asiatrip").build()); if (!found) { // Make a new bucket called 'asiatrip'. minioClient.makeBucket(MakeBucketArgs.builder().bucket("asiatrip").build()); } else { System.out.println("Bucket 'asiatrip' already exists."); } // Upload '/home/user/Photos/asiaphotos.zip' as object name 'asiaphotos-2015.zip' to bucket // 'asiatrip'. minioClient.uploadObject( UploadObjectArgs.builder() .bucket("asiatrip") .object("asiaphotos-2015.zip") .filename("/home/user/Photos/asiaphotos.zip") .build()); System.out.println( "'/home/user/Photos/asiaphotos.zip' is successfully uploaded as " + "object 'asiaphotos-2015.zip' to bucket 'asiatrip'."); } catch (MinioException e) { System.out.println("Error occurred: " + e); System.out.println("HTTP trace: " + e.httpTrace()); } } }
参考示例在media-service工程中 测试上传文件功能,
首先创建一个用于测试的bucket
点击“Manage”修改bucket的访问权限
选择public权限
在xuecheng-plus-media-service工程 的test下编写测试代码如下:
package com.xuecheng.media; import io.minio.BucketExistsArgs; import io.minio.MakeBucketArgs; import io.minio.MinioClient; import io.minio.UploadObjectArgs; import io.minio.errors.MinioException; import java.io.IOException; import java.security.InvalidKeyException; import java.security.NoSuchAlgorithmException; /** * @description 测试MinIO * @author Mr.M * @date 2022/9/11 21:24 * @version 1.0 */ public class MinioTest { static MinioClient minioClient = MinioClient.builder() .endpoint("http://192.168.101.65:9000") .credentials("minioadmin", "minioadmin") .build(); //上传文件 @Test public void upload() { try { UploadObjectArgs testbucket = UploadObjectArgs.builder() .bucket("testbucket") // .object("test001.mp4") .object("001/test001.mp4")//添加子目录 .filename("D:\\develop\\upload\\1mp4.temp") .contentType("video/mp4")//默认根据扩展名确定文件内容类型,也可以指定 .build(); minioClient.uploadObject(testbucket); System.out.println("上传成功"); } catch (Exception e) { e.printStackTrace(); System.out.println("上传失败"); } } }
contentType媒体类型:
可以查看MediaType类:
private static final long serialVersionUID = 2069937152339670231L; public static final MediaType ALL = new MediaType("*", "*"); public static final String ALL_VALUE = "*/*"; public static final MediaType APPLICATION_ATOM_XML = new MediaType("application", "atom+xml"); public static final String APPLICATION_ATOM_XML_VALUE = "application/atom+xml"; public static final MediaType APPLICATION_CBOR = new MediaType("application", "cbor"); public static final String APPLICATION_CBOR_VALUE = "application/cbor"; public static final MediaType APPLICATION_FORM_URLENCODED = new MediaType("application", "x-www-form-urlencoded"); public static final String APPLICATION_FORM_URLENCODED_VALUE = "application/x-www-form-urlencoded"; public static final MediaType APPLICATION_JSON = new MediaType("application", "json"); public static final String APPLICATION_JSON_VALUE = "application/json"; /** @deprecated */ @Deprecated public static final MediaType APPLICATION_JSON_UTF8; /** @deprecated */ @Deprecated public static final String APPLICATION_JSON_UTF8_VALUE = "application/json;charset=UTF-8"; public static final MediaType APPLICATION_OCTET_STREAM; public static final String APPLICATION_OCTET_STREAM_VALUE = "application/octet-stream"; public static final MediaType APPLICATION_PDF; public static final String APPLICATION_PDF_VALUE = "application/pdf"; public static final MediaType APPLICATION_PROBLEM_JSON; public static final String APPLICATION_PROBLEM_JSON_VALUE = "application/problem+json"; /** @deprecated */ @Deprecated public static final MediaType APPLICATION_PROBLEM_JSON_UTF8; /** @deprecated */ @Deprecated public static final String APPLICATION_PROBLEM_JSON_UTF8_VALUE = "application/problem+json;charset=UTF-8"; public static final MediaType APPLICATION_PROBLEM_XML; public static final String APPLICATION_PROBLEM_XML_VALUE = "application/problem+xml"; public static final MediaType APPLICATION_RSS_XML; public static final String APPLICATION_RSS_XML_VALUE = "application/rss+xml"; public static final MediaType APPLICATION_STREAM_JSON; public static final String APPLICATION_STREAM_JSON_VALUE = "application/stream+json"; public static final MediaType APPLICATION_XHTML_XML; public static final String APPLICATION_XHTML_XML_VALUE = "application/xhtml+xml"; public static final MediaType APPLICATION_XML; public static final String APPLICATION_XML_VALUE = "application/xml"; public static final MediaType IMAGE_GIF; public static final String IMAGE_GIF_VALUE = "image/gif"; public static final MediaType IMAGE_JPEG; public static final String IMAGE_JPEG_VALUE = "image/jpeg"; public static final MediaType IMAGE_PNG; public static final String IMAGE_PNG_VALUE = "image/png"; public static final MediaType MULTIPART_FORM_DATA; public static final String MULTIPART_FORM_DATA_VALUE = "multipart/form-data"; public static final MediaType MULTIPART_MIXED; public static final String MULTIPART_MIXED_VALUE = "multipart/mixed"; public static final MediaType MULTIPART_RELATED; public static final String MULTIPART_RELATED_VALUE = "multipart/related"; public static final MediaType TEXT_EVENT_STREAM; public static final String TEXT_EVENT_STREAM_VALUE = "text/event-stream"; public static final MediaType TEXT_HTML; public static final String TEXT_HTML_VALUE = "text/html"; public static final MediaType TEXT_MARKDOWN; public static final String TEXT_MARKDOWN_VALUE = "text/markdown"; public static final MediaType TEXT_PLAIN; public static final String TEXT_PLAIN_VALUE = "text/plain"; public static final MediaType TEXT_XML; public static final String TEXT_XML_VALUE = "text/xml"; private static final String PARAM_QUALITY_FACTOR = "q"; public static final Comparator<MediaType> QUALITY_VALUE_COMPARATOR; public static final Comparator<MediaType> SPECIFICITY_COMPARATOR;
工具类:通过扩展名找mediaType
在base工程里放置工具类:
<!--根据扩展名取mimetype--> <dependency> <groupId>com.j256.simplemagic</groupId> <artifactId>simplemagic</artifactId> <version>1.17</version> </dependency>
完整的上传文件,结合工具类:
@Test public void upload() { //根据扩展名取出mimeType ContentInfo extensionMatch = ContentInfoUtil.findExtensionMatch(".mp4"); String mimeType = MediaType.APPLICATION_OCTET_STREAM_VALUE;//通用mimeType,字节流 if(extensionMatch!=null){ mimeType = extensionMatch.getMimeType(); } try { //上传文件的参数信息 UploadObjectArgs testbucket = UploadObjectArgs.builder() .bucket("testbucket")//确定桶 // .object("test001.mp4") .object("001/test001.mp4")//添加子目录001,后面是要上传到minio的对象名。 .filename("D:\\develop\\upload\\1mp4.temp")//指定本地文件路径 .contentType(mimeType)//默认根据扩展名确定文件内容类型,也可以指定 .build(); minioClient.uploadObject(testbucket); System.out.println("上传成功"); } catch (Exception e) { e.printStackTrace(); System.out.println("上传失败"); } }
如何判断文件完整上传到minio
可以将文件下载到本地看文件是否完整。
删除文件
下边测试删除文件
参考:MinIO Object Storage for Kubernetes — MinIO Object Storage for Kubernetes
@Test public void delete(){ try { minioClient.removeObject( RemoveObjectArgs.builder().bucket("testbucket").object("001/test001.mp4").build()); System.out.println("删除成功"); } catch (Exception e) { e.printStackTrace(); System.out.println("删除失败"); } }
查询文件
通过查询文件查看文件是否存在minio中。
参考:MinIO Object Storage for Kubernetes — MinIO Object Storage for Kubernetes
@Test public void getFile() { GetObjectArgs getObjectArgs = GetObjectArgs.builder().bucket("testbucket").object("test001.mp4").build(); try( FilterInputStream inputStream = minioClient.getObject(getObjectArgs); FileOutputStream outputStream = new FileOutputStream(new File("D:\\develop\\upload\\1_2.mp4")); ) { IOUtils.copy(inputStream,outputStream); } catch (Exception e) { e.printStackTrace(); } }
校验文件完整性
校验文件的完整性,对文件计算出md5值,比较原始文件的md5和目标文件的md5,一致则说明完整
//校验文件的完整性对文件的内容进行md5 FileInputStream fileInputStream1 = new FileInputStream(new File("D:\\develop\\upload\\1.mp4")); String source_md5 = DigestUtils.md5Hex(fileInputStream1); FileInputStream fileInputStream = new FileInputStream(new File("D:\\develop\\upload\\1a.mp4")); String local_md5 = DigestUtils.md5Hex(fileInputStream); if(source_md5.equals(local_md5)){ System.out.println("下载成功"); }
比较硬盘上的文件1和从minio中下载到本地的文件local1.mp4的md5值,而不去对比远程流inputStream。
FilterInputStream inputStream = minioClient.getObject(getObjectArgs);
从文件系统拿输入流,是一个远程的流,通过网络获取数据不稳定,因此校验时不要传输远程流.
完整的下载文件代码
@Test public void getFile() { GetObjectArgs getObjectArgs = GetObjectArgs.builder().bucket("testbucket").object("001/test1.mp4").build(); try( FilterInputStream inputStream = minioClient.getObject(getObjectArgs);//从文件系统拿输入流,是一个远程的流,通过网络获取数据,不要传输远程流 FileOutputStream outputStream = new FileOutputStream(new File("D:\\develop\\upload\\local1.mp4"));//下载到本地需要输入流 ) { IOUtils.copy(inputStream,outputStream);//流拷贝,输入流考入到输出流里 //校验下载下来的文件的完整性,上传也需要,注意MD5引用的是apache的包 //对文件的内容进行md5得到摘要串,然后和minio中存储的文件的摘要串进行比较,看值是否相等 // FileInputStream fileInputStream1 = new FileInputStream(new File("D:\\develop\\upload\\1.mp4")); // String source_md5 = DigestUtils.md5Hex(inputStream);//minio中的文件的md5 FileInputStream fileInputStream1 = new FileInputStream(new File("D:\\develop\\upload\\1.mp4")); String source_md5 = DigestUtils.md5Hex(fileInputStream1);//比较硬盘上的文件1和从minio中下载到本地的文件local1.mp4的md5值,而不去对比远程流inputStream FileInputStream fileInputStream = new FileInputStream(new File("D:\\develop\\upload\\local1.mp4")); String local_md5 = DigestUtils.md5Hex(fileInputStream); if(source_md5.equals(local_md5)){ System.out.println("下载成功"); } } catch (Exception e) { e.printStackTrace(); }
完整minio测试代码:
注意工具类包的引用区别,例如MD5引用的是apache的,而不是springframe框架的。
package com.xuecheng.media; import com.j256.simplemagic.ContentInfo; import com.j256.simplemagic.ContentInfoUtil; import io.minio.GetObjectArgs; import io.minio.MinioClient; import io.minio.RemoveObjectArgs; import io.minio.UploadObjectArgs; import org.apache.commons.codec.digest.DigestUtils; import org.apache.commons.compress.utils.IOUtils; import org.junit.jupiter.api.Test; import org.springframework.http.MediaType; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.FilterInputStream; public class MinioTest { //首先要有一个客户端 //需要到minio里把bucket的权限改成public static MinioClient minioClient = MinioClient.builder() .endpoint("http://192.168.101.65:9000") .credentials("minioadmin", "minioadmin") .build(); //测试上传文件 //上传文件 @Test public void upload() { //根据扩展名取出mimeType ContentInfo extensionMatch = ContentInfoUtil.findExtensionMatch(".mp4"); String mimeType = MediaType.APPLICATION_OCTET_STREAM_VALUE;//通用mimeType,字节流 if(extensionMatch!=null){ mimeType = extensionMatch.getMimeType(); } try { //上传文件的参数信息 UploadObjectArgs testbucket = UploadObjectArgs.builder() .bucket("testbucket")//确定桶 // .object("test001.mp4") .object("001/test1.mp4")//添加子目录001,后面是要上传到minio的对象名。 .filename("D:\\develop\\upload\\1.mp4")//指定本地文件路径 .contentType(mimeType)//默认根据扩展名确定文件内容类型,也可以指定 .build(); minioClient.uploadObject(testbucket); System.out.println("上传成功"); } catch (Exception e) { e.printStackTrace(); System.out.println("上传失败"); } } //测试删除文件 @Test public void delete(){ try { minioClient.removeObject( RemoveObjectArgs.builder() .bucket("testbucket") .object("001/test1.mp4") .build()); System.out.println("删除成功"); } catch (Exception e) { e.printStackTrace(); System.out.println("删除失败"); } } //查询文件,从minio中下载文件 @Test public void getFile() { GetObjectArgs getObjectArgs = GetObjectArgs.builder().bucket("testbucket").object("001/test1.mp4").build(); try( FilterInputStream inputStream = minioClient.getObject(getObjectArgs);//从文件系统拿输入流,是一个远程的流,通过网络获取数据,不要传输远程流 FileOutputStream outputStream = new FileOutputStream(new File("D:\\develop\\upload\\local1.mp4"));//下载到本地需要输入流 ) { IOUtils.copy(inputStream,outputStream);//流拷贝,输入流考入到输出流里 //校验下载下来的文件的完整性,上传也需要,注意MD5引用的是apache的包 //对文件的内容进行md5得到摘要串,然后和minio中存储的文件的摘要串进行比较,看值是否相等 // FileInputStream fileInputStream1 = new FileInputStream(new File("D:\\develop\\upload\\1.mp4")); // String source_md5 = DigestUtils.md5Hex(inputStream);//minio中的文件的md5 FileInputStream fileInputStream1 = new FileInputStream(new File("D:\\develop\\upload\\1.mp4")); String source_md5 = DigestUtils.md5Hex(fileInputStream1);//比较硬盘上的文件1和从minio中下载到本地的文件local1.mp4的md5值,而不去对比远程流inputStream FileInputStream fileInputStream = new FileInputStream(new File("D:\\develop\\upload\\local1.mp4")); String local_md5 = DigestUtils.md5Hex(fileInputStream); if(source_md5.equals(local_md5)){ System.out.println("下载成功"); } } catch (Exception e) { e.printStackTrace(); } } }