HDFS写流程
串行写。
写得过程中是以packet(64k)为单位进行写。
packet = chunk 512byte +chunksum 4byte(校验位)
写过程中,首先在缓存区中形成一个个得chunk+chunksum,然后得到packet,再讲packet放在缓冲队列中,在向DataNode输入数据。
HDFS读流程
不能并行读,只能串行读。
并行和并发的区别
进程:系统分配资源的最小单位。进程包括多个线程。
线程:程序执行的最小单位,是cpu调度的最小单位。
并发:指的是多个线程进行操作的时候,系统只有一个cpu,不可能同时执行两个线程,只能分时间段进行线程的运行,在一个时间段进行线程运行,其余线程处于挂起状态。
并行:指的是不抢占cpu资源,系统有两个及以上的cpu时候。当一个CPU执行一个线程时,另一个CPU可以执行 另一个线程,两个线程互不抢占CPU资源,可以同时进行,这种方式我们称之为并行。
2NN
命令: sz a.txt 将虚拟机的a.txt存到本地。
NameNode , NameNodeSecurity,一般不用了。企业会搭建两个NameNode的高可用。