【Lucene】IndexReader类的maxDoc()与numDocs()的区别

转载 2013年12月02日 21:29:04

http://hi.baidu.com/sunky/item/31fdfef9ad1a9d763d198b47


1)Let us see the difference in the comment of  Class IndexReader

  /** Returns the number of documents in this index. */
  public abstract int numDocs();

  /** Returns one greater than the largest possible document number.
   This may be used to, e.g., determine how big to allocate an array which
   will have an element for every document number in an index.
   */
  public abstract int maxDoc();

2) Actually, the real code to implement is the best explanation. The implemetation Class of IndexReader is SegmentReader. Let us see theire implementations as below:

  public final int maxDoc() {
    return fieldsReader.size();
  }

  public final int numDocs() {
    int n = maxDoc();
    if (deletedDocs != null)
      n -= deletedDocs.count();
    return n;
  }

  I think it is easy to understand the reason now !

(五)Lucene中maxDoc 和numDocs()方法的区别

特别注意maxDoc 和numDocs()方法的区别: maxDoc()返回索引中删除和未被删除的文档总数, numDocs() 返回索引中未被删除的文档总数, 因为我们删除一个索引之后并不是真正的删...
  • u011712163
  • u011712163
  • 2017年11月18日 17:19
  • 118

全文检索引擎Solr系列——入门篇

Solr采用Lucene搜索库为核心,提供全文索引和搜索开源企业平台,提供REST的HTTP/XML和JSON的API,如果你是Solr新手,那么就和我一起来入门吧!本教程以solr4.8作为测试环境...
  • yjl33
  • yjl33
  • 2016年06月14日 09:44
  • 1997

Solr开发步骤

不错,原作者不明 Solr 是一种可供企业使用的、基于 Lucene 的搜索服务器,它支持层面搜索、命中醒目显示和多种输出格式。在这篇文章中,将介绍 Solr 并展示如何轻松地将其表现优异的全...
  • langyuewu
  • langyuewu
  • 2015年05月07日 10:47
  • 1137

IndexReader中maxDoc()和numDocs()的区别

maxDoc()和numDocs()。前者返回下一个可用的内部Document号,后者返回索引中的Document的数目。因为我们的索引只含有两个Document,numDocs()返回2;又因为Do...
  • asdfsadfasdfsa
  • asdfsadfasdfsa
  • 2017年09月23日 16:33
  • 161

Lucene5 学习笔记(3) —— 重用 IndexReader 和常用的搜索方法

02_lucene简介和搜索初步.avi
  • lw_power
  • lw_power
  • 2015年03月01日 22:47
  • 2552

solr应用

Solrj已经是很强大的solr客户端了。它本身就包装了httpCliet,以完全对象的方式对solr进行交互。很小很好很强大。     不过在实际使用中,设置SolrQuery 的过程中,为了设置...
  • wushuchu
  • wushuchu
  • 2016年09月28日 15:40
  • 629

solr完整教程

目录(?)[-] 概述 企业搜索引擎方案选型Solr的特性 Solr使用Lucene并且进行了扩展Schema模式查询核心缓存复制管理接口 Solr服务原理  索引 搜索 ...
  • yz7074998
  • yz7074998
  • 2015年01月21日 17:17
  • 7305

Lucene六(IndexReader的设计)

IndexReader和IndexWriter的打开是非常消耗资源的,一般我们在项目中都将IndexReader设计为单例,有的项目中将IndexWriter也设计为单例。由于将IndexReader...
  • u013365786
  • u013365786
  • 2015年08月01日 10:07
  • 489

使用Lucene的IndexReader读取索引文件的信息

/*前面学习了创建索引的方法是IndexWriter,这里所使用的是读取所创建的  * 索引的方法IndexReader.  * 和他的子类  * MultiReader  * */ pac...
  • u012965373
  • u012965373
  • 2015年03月21日 10:53
  • 2703

solr教程

Solr调研总结 开发类型 全文检索相关开发 Solr版本 4.2 文件内容 本文介绍solr的功能使用及相关注意事...
  • nlwangxin
  • nlwangxin
  • 2014年12月02日 17:20
  • 9386
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:【Lucene】IndexReader类的maxDoc()与numDocs()的区别
举报原因:
原因补充:

(最多只允许输入30个字)