hadoop
文章平均质量分 91
zdkdchao
这个作者很懒,什么都没留下…
展开
-
yarn(cdh)中的虚拟cpu和内存
YARN同时支持内存和CPU两种资源的调度,默认只支持内存,如果想进一步调度CPU,需要自己进行一些配置。什么是虚拟cpu目前的CPU被划分成虚拟CPU(CPU virtual Core),这里的虚拟CPU是YARN自己引入的概念,初衷是,考虑到不同节点的CPU性能可能不同,每个CPU具有的计算能力也是不一样的,比如某个物理CPU的计算能力可能是另外一个物理CPU的2倍,这时候,你可以通过为第一个物理CPU多配置几个虚拟CPU弥补这种差异。用户提交作业时,可以指定每个任务需要的虚拟CPU个数。内存资源转载 2021-10-12 09:00:08 · 1039 阅读 · 0 评论 -
mr-wordcount
3部分,driver、map、reduce一个block分配一个map进程,入参是一行一个reduce只会处理一个key,入参是<key,Iterator<value>>,也就是说,有多少个key,就会有多少个reduce进程map//key是google的历史遗留问题,只有在创建搜索引擎索引的时候才用得到//value就是一行,默认的InputFormat是按行读//context是个分布式的环境,用来传输//Text不要每次都创建,使用一个共享的Text text原创 2020-11-03 10:54:08 · 330 阅读 · 0 评论