(1)dfs.replication
指定hdfs上传文件时的副本数,默认是3。
分布式系统上的文件副本数,由上传时的系统副本数决定,不会受后面replication的更改而变化,除非用命令来更改文件的副本数。
因为dfs.replication实质上是client参数,所以可以在上传文件时指定具体replication数量,属性dfs.replication是不指定具体replication时的采用默认备份数,因为dfs.replication这个参数是个client参数,即node level参数,需要在每台datanode上设置。其实默认为3个副本已经够用了,设置太多也没什么用。
文件上传后,备份数已定,修改dfs.replication不会影响以前的文件副本数量,也不会影响后面上传文件时指定备份数的文件,只影响后面采用默认备份数的文件。
在上传文件的同时指定创建的副本数
[kaadmin@oceanbase06 ~]$ hdfs dfs -D dfs.replication=1 -put ord_pay.csv /lijk
[kaadmin@oceanbase06 ~]$ hdfs dfs -D dfs.replication=3 -put test1.txt /lijk
[kaadmin@oceanbase06 ~]$ hdfs dfs -