HDFS写数据流:
1.客户端通过调用,分布式文件系统对象中的Create()创建一个文件,分布式文件系统通过PRC调用的NN中的文件系统命名空间创建一个新文件。
2.NN会验证客户端的权限和文件存不存在于文件系统中。
3.验证通过后会创建一个新的文件记录,并返回一个文件系统数据输出流(用来写数据)。
4.客户端通过文件系统数据输出流的Write()函数,写入数据。
5.DFSDateOutputStream会将文件分成一个个数据块。
6.数据块以次存储进几个(默认3个)数据节点。
7.最后向客户端发送结束消息。