NutchBean详解之初始化

NutchBean是实现nutch查询的一个入口,就像Nutch中的crawl一样。在NutchBean的mian函数中,以下一行代码实现了初始化:

final NutchBean bean = new NutchBean(conf);

  这行代码涉及到的东西很多,包括初始化了LuceneSearchBean、IndexSearcher、FetchedSegments以及lucene中的查询类IndexSearcher(注意:前一个IndexSearcher是nutch的,而后一个是Lucene的)。

 

 

 

 

代码展示如下:

 final NutchBeanbean = new NutchBean(conf);

 

public NutchBean(Configuration conf) throws IOException {

    this(conf, null);

  }

 

public NutchBean(Configuration conf, Path dir) throws IOException {

。。。。。。//省略

searchBean = new LuceneSearchBean(conf, indexDir, indexesDir);

。。。。。。//省略

segmentBean = new FetchedSegments(conf, segments);

}

 

 初始化LuceneSearchBena的代码:

   publicLuceneSearchBean(Configuration conf, Path indexDir, Path indexesDir)

  throws IOException {

    this.conf = conf;

    this.fs =FileSystem.get(this.conf);

    init(indexDir, indexesDir);

  }

 

 privatevoid init(Path indexDir, Path indexesDir)

  throws IOException {

    Path absIndexDir =indexDir.makeQualified(indexDir.getFileSystem(conf));

    Path absIndexesDir =indexesDir.makeQualified(indexesDir.getFileSystem(conf));

   //TODO

    Path indexDirAddtion=newPath("E:/out/index");

    Path[] indexes=new Path[2];

   

    if (this.fs.exists(indexDir)) {

      LOG.info("opening mergedindex in " + absIndexDir.toUri());

      //TODO

      indexes[0]=indexDir;

      indexes[1]=indexDirAddtion;

     

      //this.searcher = newIndexSearcher(indexDir, this.conf);

      //TODO

      /*此处做了修改,将IndexSearcher中的参数Path,改为Path[],用于

       * 对多个索引路径进行查询*/

    this.searcher=newIndexSearcher(indexes,this.conf);

    } else {

      if (!this.fs.exists(indexesDir)){

        // should throw exception ?

        LOG.warn("Neither "+ absIndexDir.toUri() + " nor " +

                absIndexesDir.toUri()+ " found!");

      } else {

        LOG.info("openingindexes in " + absIndexesDir.toUri());

      }

      List<Path> vDirs = newArrayList<Path>();

      FileStatus[] fstats =fs.listStatus(indexesDir, HadoopFSUtil.getPassDirectoriesFilter(fs));

      Path[] directories =HadoopFSUtil.getPaths(fstats);

      for(int i = 0; i <directories.length; i++) {

        Path indexdone = newPath(directories[i], Indexer.DONE_NAME);

        if(fs.isFile(indexdone)) {

          vDirs.add(directories[i]);

        }

      }

 

      directories = new Path[vDirs.size() ];

      for(int i = 0;vDirs.size()>0; i++) {

        directories[i] =vDirs.remove(0);

      }

 

      this.searcher = newIndexSearcher(directories, this.conf);

    }

  }

 

IndexSearcher的代码如下:

public IndexSearcher(Path[] indexDirs, Configuration conf) throwsIOException {

    IndexReader[] readers = newIndexReader[indexDirs.length];

    this.conf = conf;

    this.fs = FileSystem.get(conf);

    for (int i = 0; i <indexDirs.length; i++) {

      readers[i] =IndexReader.open(getDirectory(indexDirs[i]));

    }

    init(new MultiReader(readers),conf);

  }

private void init(IndexReader reader, Configuration conf) throwsIOException {

    this.reader = reader;

    this.luceneSearcher = new

org.apache.lucene.search.IndexSearcher(reader);

   this.luceneSearcher.setSimilarity(new NutchSimilarity());

    this.optimizer = newLuceneQueryOptimizer(conf);

    this.queryFilters = newQueryFilters(conf);

  }

初始化luceneIndexSearcher

privateIndexSearcher(IndexReader r, boolean closeReader) {

    reader = r;

    this.closeReader = closeReader;

 

    List<IndexReader> subReadersList =new ArrayList<IndexReader>();

    gatherSubReaders(subReadersList, reader);

    subReaders = subReadersList.toArray(newIndexReader[subReadersList.size()]);

    docStarts = new int[subReaders.length];

    int maxDoc = 0;

    for (int i = 0; i < subReaders.length;i++) {

      docStarts[i] = maxDoc;

      maxDoc += subReaders[i].maxDoc();

    }

  }

 

初始化segmentBean

public FetchedSegments(Configurationconf, Path[] segmentsDir)

  throws IOException {

    this.conf = conf;

    this.fs = FileSystem.get(this.conf);

    final FileStatus[] fstats = fs.listStatus(segmentsDir,

        HadoopFSUtil.getPassDirectoriesFilter(fs));

    final Path[] segmentDirs = HadoopFSUtil.getPaths(fstats);

    this.summarizer = new SummarizerFactory(this.conf).getSummarizer();

    this.segmentsDir = segmentsDir;

    this.segUpdater = new SegmentUpdater();

 

    if (segmentDirs != null) {

      for (final Path segmentDir : segmentDirs){

        segments.put(segmentDir.getName(),

          new Segment(this.fs, segmentDir, this.conf));

      }

    }

    this.segUpdater.start();

  }

注意:在实现跨索引查询的时候,除了修改luceneSearchBean中的初始化代码,还得修改sgementBean中的代码。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在MATLAB中,NURBS(非均匀有理B样条)是一种强大的数学工具,用于表示和处理复杂的曲线和曲面。NURBS在计算机图形学、CAD(计算机辅助设计)、CAM(计算机辅助制造)等领域有着广泛的应用。下面将详细探讨MATLAB中NURBS的绘制方法以及相关知识点。 我们需要理解NURBS的基本概念。NURBS是B样条(B-Spline)的一种扩展,其特殊之处在于引入了权重因子,使得曲线和曲面可以在不均匀的参数空间中进行平滑插值。这种灵活性使得NURBS在处理非均匀数据时尤为有效。 在MATLAB中,可以使用`nurbs`函数创建NURBS对象,它接受控制点、权值、 knot向量等参数。控制点定义了NURBS曲线的基本形状,而knot向量决定了曲线的平滑度和分布。权值则影响曲线通过控制点的方式,大的权值会使曲线更靠近该点。 例如,我们可以使用以下代码创建一个简单的NURBS曲线: ```matlab % 定义控制点 controlPoints = [1 1; 2 2; 3 1; 4 2]; % 定义knot向量 knotVector = [0 0 0 1 1 1]; % 定义权值(默认为1,如果未指定) weights = ones(size(controlPoints,1),1); % 创建NURBS对象 nurbsObj = nurbs(controlPoints, weights, knotVector); ``` 然后,我们可以用`plot`函数来绘制NURBS曲线: ```matlab plot(nurbsObj); grid on; ``` `data_example.mat`可能包含了一个示例的NURBS数据集,其中可能包含了控制点坐标、权值和knot向量。我们可以通过加载这个数据文件来进一步研究NURBS的绘制: ```matlab load('data_example.mat'); % 加载数据 nurbsData = struct2cell(data_example); % 转换为cell数组 % 解析数据 controlPoints = nurbsData{1}; weights = nurbsData{2}; knotVector = nurbsData{3}; % 创建并绘制NURBS曲线 nurbsObj = nurbs(controlPoints, weights, knotVector); plot(nurbsObj); grid on; ``` MATLAB还提供了其他与NURBS相关的函数,如`evalnurbs`用于评估NURBS曲线上的点,`isoparm`用于生成NURBS曲面上的等参线,以及`isocurve`用于在NURBS曲面上提取特定参数值的曲线。这些工具对于分析和操作NURBS对象非常有用。 MATLAB中的NURBS功能允许用户方便地创建、编辑和可视化复杂的曲线和曲面。通过对控制点、knot向量和权值的调整,可以精确地控制NURBS的形状和行为,从而满足各种工程和设计需求。通过深入理解和熟练掌握这些工具,可以在MATLAB环境中实现高效的NURBS建模和分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值