【框架解析】Hadoop系统分析(二)--代码模块汇总

12 篇文章 0 订阅

查看Hadoop的源码包,主要分为以下几个模块:

  1. core
    package作用sub-package
    org.apache.hadoop.conf读取及解析配置文件 
    org.apache.hadoop.fs支持各种文件系统数据操作以及处理文件系统权限org.apache.hadoop.fs.ftp,
    org.apache.hadoop.fs.kfs,
    org.apache.hadoop.fs.permission, 
    org.apache.hadoop.fs.s3,
    org.apache.hadoop.fs.s3native,
    org.apache.hadoop.fs.shell 
    org.apache.hadoop.http启动Jetty服务器用来接收http请求org.apache.hadoop.http.lib
    org.apache.hadoop.io负责对象的序列化,输入输出,压缩格式等等org.apache.hadoop.io.compress,
    org.apache.hadoop.io.compress.bzip2,
    org.apache.hadoop.io.zlib, 
    org.apache.hadoop.io.file.tfile,
    org.apache.hadoop.io.nativeio,
    org.apache.hadoop.io.retry,
    org.apache.hadoop.io.serializer
    org.apache.hadoop.ipc实现hadoop集群的rpc接口,提供rpc的服务器端、客户端类org.apache.hadoop.ipc.metrics
    org.apache.hadoop.log日志统计相关类org.apache.hadoop.log.metrics
    org.apache.hadoop.metrics 
    org.apache.hadoop.metrics2 
    统计指标相关类,用来支持集群的性能监控org.apache.hadoop.metrics.file,
    org.apache.hadoop.metrics.ganglia,
    org.apache.hadoop.metrics.jvm, 
    org.apache.hadoop.metrics.spi,
    org.apache.hadoop.metrics.util,
    org.apache.hadoop.metrics2.filter, 
    org.apache.hadoop.metrics2.impl,
    org.apache.hadoop.metrics2.lib,
    org.apache.hadoop.metrics2.sink, 
    org.apache.hadoop.metrics2.sink.ganglia,
    org.apache.hadoop.metrics2.source,
    org.apache.hadoop.metrics2.util 
    org.apache.hadoop.net提供网络服务的支持 
    org.apache.hadoop.record处理对输入输出的数据记录的支持org.apache.hadoop.record.compiler,
    org.apache.hadoop.record.compiler.ant,
    org.apache.hadoop.record.compiler.generated,
     org.apache.hadoop.record.meta 
    org.apache.hadoop.security处理hadoop集群的安全认证支持org.apache.hadoop.security.authentication.client,
    org.apache.hadoop.security.authentication.server, 
    org.apache.hadoop.security.authentication.util,
    org.apache.hadoop.security.authorize,
    org.apache.hadoop.security.token, 
    org.apache.hadoop.security.token.delegation 
    org.apache.hadoop.util工具包org.apache.hadoop.util.bloom,
    org.apache.hadoop.util.hash

  2. hdfs
    package作用sub-package
    org.apache.hadoop.hdfs提供分布式文件系统基本类,如文件系统、客户端等 
    org.apache.hadoop.hdfs.protocolhdfs基础对象,如数据块、客户端传输协议、分布式文件信息等 
    org.apache.hadoop.hdfs.securitytoken的管理与使用,包括代理token和块tokenorg.apache.hadoop.hdfs.security.token.block,
    org.apache.hadoop.hdfs.security.token.delegation
    org.apache.hadoop.hdfs.server服务器运转,包括namenode与datanodeorg.apache.hadoop.hdfs.server.balancer,
    org.apache.hadoop.hdfs.server.common,
    org.apache.hadoop.hdfs.server.datanode,
    org.apache.hadoop.hdfs.server.datanode.metrics,
    org.apache.hadoop.hdfs.server.datanode.web.resources,
    org.apache.hadoop.hdfs.server.namenode,
    org.apache.hadoop.hdfs.server.namenode.metrics,
    org.apache.hadoop.hdfs.server.namenode.web.resources,
    org.apache.hadoop.hdfs.server.protocol
    org.apache.hadoop.hdfs.tools辅助工具 
    org.apache.hadoop.hdfs.util 工具类 
    org.apache.hadoop.hdfs.web提供web访问支持 

  3. mapred
    package作用sub-package
    org.apache.hadoop.filecache分布式cache 
    org.apache.hadoop.mapred进行job的分布式计算(兼容0.20.2以前版本) 
    org.apache.hadoop.mapred.jobcontrol用来控制job执行的顺序(兼容0.20.2以前版本) 
    org.apache.hadoop.mapred.join辅助进行join操作(兼容0.20.2以前版本) 
    org.apache.hadoop.mapred.lib提供lib供编写mr计算使用,如outputformat,inputformat,mapper,reducer等(兼容0.20.2以前版本)org.apache.hadoop.mapred.lib.aggregate,
    org.apache.hadoop.mapred.lib.db
    org.apache.hadoop.mapred.pipes使用pipe方式进行计算(兼容0.20.2以前版本) 
    org.apache.hadoop.mapred.tools提供管理工具MRAdmin来管理任务(兼容0.20.2以前版本) 
    org.apache.hadoop.mapreduce进行job分布式计算(0.20.2及以后版本) 
    org.apache.hadoop.mapreduce.lib提供常用lib供编写mr计算使用org.apache.hadoop.mapreduce.lib.input,
    org.apache.hadoop.mapreduce.lib.map, 
    org.apache.hadoop.mapreduce.lib.output,
    org.apache.hadoop.mapreduce.lib.partition,
    org.apache.hadoop.mapreduce.lib.reduce 
    org.apache.hadoop.mapreduce.security处理job使用的tokenorg.apache.hadoop.mapreduce.security.token,
    org.apache.hadoop.mapreduce.security.token.delegatio
    org.apache.hadoop.mapreduce.server提供jobtracker与tasktracker的服务org.apache.hadoop.mapreduce.server.jobtracker,
    org.apache.hadoop.mapreduce.server.tasktracker, 
    org.apache.hadoop.mapreduce.server.tasktracker.userlogs 
    org.apache.hadoop.mapreduce.split进行任务分片 


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值