InjectorJob架构及流程

一、InjectorJob类结构分析

InjectorJob类图

由图可见,Injector类实现了接口Tool,继承自NutchTool类,有一个继承自Mapper的内部类UrlMapper。

二 InjectorJob类的运行流程

InjectorJob运行流程

三 InjectorJob类运行流程详解
1、 main函数:提供函数入口,创建一个ToolRunner类,先加载Nutch的两个配置文件nutch-default.xml和nutch-site.xml文件,接收命令行输入参数并创建一个InjectorJob类。接下来程序跳转到run(String[] args)函数。

2、run(String[] args)函数:接收命令行输入的参数,判断从命令行当中接收的参数是否合理,如果没有输入参数或者输入参数不合理,则提示正确的输入方法;如果输入参数正确,则跳转到inject函数。

3、 inject(Path urlDir)函数:通过参数args[0]创建path实例,表示种子文件的目录。该函数打印了inject开始的一些基本信息之后跳转到run(ToolUtil.toArgMap(Nutch.ARG_SEEDDIR, urlDir))函数,执行InjectorJob类的和核心部分

4、 run(ToolUtil.toArgMap(Nutch.ARG_SEEDDIR, urlDir)):该函数调用了hadoo

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值