lucene 索引创建域选项

一、域索引选项:
 

//Field.Index(索引域选项)
//Index.ANALYZED:进行分词和索引,适用于标题、内容等
//Index.NOT_ANALYZED:进行索引,但是不进行分词,如果身份证号,姓名,ID等,适用于精确搜索
//Index.ANALYZED_NOT_NORMS:进行分词但是不存储norms信息,这个norms中包括了创建索引的时间和权值等信息
//Index.NOT_ANALYZED_NOT_NORMS:即不进行分词也不存储norms信息
//Index.NO:不进行索引

 

二、域存储选项:

//Field.Store.YES或者NO(存储域选项)
//设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原
//设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)

 

三、最佳实践:

ANALYZEDYES文档标题和摘要
ANALYZEDNO文档正文
NOT_ANALYZEDYES标识符(主键、文件名),电话号码、身份证号,姓名,日期
NOT_ANALYZEDNO隐藏关键字
NOYES文档类型,数据库主键(不进行索引)

示例代码:

/**
 * lucene 索引创建域选项
 * @author lenovo
 *
 */
public class IndexUtil {

	private String[] ids={"1","2","3","4","5","6"};
	private String[] emails={"wbb@126.com","aaa@126.com","bbb@126.com","ccc@126.com","ddd@126.com","fff@126.com"};
	private String[] contents={"dfh fdhx fbxf bxfh f","dfjtyfhfd rhdbdx zhfxvz","tt tfv dgfb  zzbz zfgdf"
			                 ,"edd dseg dfd","dgdz sdfs sfzs","dsgzc zcsg dsd sdsd"};
	private int[] attachs={2,3,4,0,5,2};
	private String[] names={"wbb1","wbb2","wbb3","wbb4","wbb5","wbb6"};
	private Directory directory=null;
	
	public IndexUtil(){
		try {
			//创建directory
			directory=FSDirectory.open(new File("E:/luceneWorkspace/test/index02"));
		} catch (IOException e) {
			e.printStackTrace();
		}
	}
	
	public void index(){
		IndexWriter writer=null;
		try {
			//创建writer
			writer=new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_36,new StandardAnalyzer(Version.LUCENE_36)));
			Document doc=null;
			for (int i = 0; i < ids.length; i++) {
				//创建文档  并且添加索引和域
				//文档相当于表中的每一条数据    域相当于字段
				doc=new Document();
				//Field.Store.YES或者NO(存储域选项)
				//设置为YES表示或把这个域中的内容完全存储到文件中,方便进行文本的还原
				//设置为NO表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原(doc.get)
				//Field.Index(索引域选项)
				//Index.ANALYZED:进行分词和索引,适用于标题、内容等
				//Index.NOT_ANALYZED:进行索引,但是不进行分词,如果身份证号,姓名,ID等,适用于精确搜索
				//Index.ANALYZED_NOT_NORMS:进行分词但是不存储norms信息,这个norms中包括了创建索引的时间和权值等信息
				//Index.NOT_ANALYZED_NOT_NORMS:即不进行分词也不存储norms信息
				//Index.NO:不进行索引
				doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
				doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));
				doc.add(new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED));
				doc.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
				//将文档写到索引中
				writer.addDocument(doc);
			}
		} catch (Exception e) {
			e.printStackTrace();
		}finally{
			if(writer!=null){
				try {
					writer.close();
				} catch (CorruptIndexException e) {
					e.printStackTrace();
				} catch (IOException e) {
					e.printStackTrace();
				}
			}
		}
	}
	
	
	public void query(){
		try {
			//创建reader
			IndexReader reader=IndexReader.open(directory);
			//通过reader可以获取文档的数量
			System.out.println("numDocs:"+reader.numDocs());
			System.out.println("maxDocs:"+reader.maxDoc());
			reader.close();
		} catch (CorruptIndexException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		
		
		
	}
	
	
}


 

以上内容主要是回顾创建索引---》怎么设置域--》查询索引

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值