Hadoop
ukakasu
这个作者很懒,什么都没留下…
展开
-
hadoop知识点总结
HDFS 读流程 filesystem类是一个抽象类,其实现类是distributedfilesystem,打开文件时调用其open方法,DFSclient通过rpc协议获取namenode的代理对象,得到块的信息,返回FSdatainputstream对象,通过其read方法连接到datanode读取数据,数据读取完毕时关闭FSdatainputstream。 写流程 写入文件时调用cr原创 2015-10-24 15:31:25 · 361 阅读 · 0 评论 -
设置Mapper数量与各节点container数量
container数目设置RM的内存资源配置,主要是通过下面的两个参数进行的(这两个值是Yarn平台特性,应在yarn-site.xml中配置好):yarn.scheduler.minimum-allocation-mbyarn.scheduler.maximum-allocation-mb说明:单个容器可申请的最小与最大内存,应用在运行申请内存时不能超过最大值,小于最小值则分配最小值,从这个角度...原创 2018-04-20 13:45:42 · 4789 阅读 · 0 评论