定义: 数据量越来越多,一个操作系统管辖的范围存不下,那么就需要分配到更多的操作系统管理的磁盘中,但是不方便管理和维护。因此就需要一个
系统来管理多台机器上的文件,这就是分布式文件管理系统。
允许文件通过网络在多台主机上分享的文件系统,可以让多台机器上的多用户分享文件和存储空间。
容错,即使系统中某些节点脱机,整体来说系统仍然可以持续运作,不会有数据损伤。这一点可以用多个地方存储来解决。
分布式文件系统有很多种,比如TFS(淘宝的文件存储系统),GFS,GridFS,HDFS(hadoop分布式文件系统)只是其中一种。适合一次写入,多次读取查询的情况。不支持并发写情况,小文件不适合。
不能像数据库一样进行增删改查,需要下载下来修改重新上传。
不支持并发写是如果有1G文件,写到8块datanode。不是八块文件一起写。。一个个写,这是不支持并发写,也就是不支持并发存储。