Lucene知识小总结7:评分设置

最新推荐文章于 2019-09-21 00:07:30 发布

weixin_33911824

最新推荐文章于 2019-09-21 00:07:30 发布

阅读量155

点赞数

文章标签： python

原文链接：https://my.oschina.net/heroShane/blog/202432

版权

2019独角兽企业重金招聘Python工程师标准>>>

使用lucene，我们通过搜索出来的信息，都是相关性最强的排在前面的，这里涉及到评分机制，在实际生产中必定是要根据具体的业务需求做出更为复杂的自定义评分机制，但这里先简单看看lucene的评分是如何设定的。

         private Map<String,Float> scores = new HashMap<String,Float>();
        //构造函数
	public IndexUtil() {
		try {
			setDates();
			//设置Score相对高的信息
			scores.put("itat.org",2.0f);
			scores.put("zttc.edu", 1.5f);
			directory = FSDirectory.open(new File("d:/lucene/index02"));
		} catch (IOException e) {
			e.printStackTrace();
		}

	}
	//创建索引
	public void index() {
		IndexWriter writer = null;
		try {
			writer = new IndexWriter(directory, new IndexWriterConfig(Version.LUCENE_35, new StandardAnalyzer(Version.LUCENE_35)));
			writer.deleteAll();
			Document doc = null;
			for(int i=0;i<ids.length;i++) {
				doc = new Document();
				doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
				doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));
				doc.add(new Field("email","test"+i+"@test.com",Field.Store.YES,Field.Index.NOT_ANALYZED));
				doc.add(new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED));
				doc.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
				//存储数字
				doc.add(new NumericField("attach",Field.Store.YES,true).setIntValue(attachs[i]));
				//存储日期
				doc.add(new NumericField("date",Field.Store.YES,true).setLongValue(dates[i].getTime()));
				//截取@后面的字段
				String et = emails[i].substring(emails[i].lastIndexOf("@")+1);
				//设置评分
				if(scores.containsKey(et)) {
					doc.setBoost(scores.get(et));
				} else {
					doc.setBoost(0.5f);
				}
				writer.addDocument(doc);
			}
		} catch (CorruptIndexException e) {
			e.printStackTrace();
		} catch (LockObtainFailedException e) {
			e.printStackTrace();
		} catch (IOException e) {
			e.printStackTrace();
		} finally {
			try {
				if(writer!=null)writer.close();
			} catch (CorruptIndexException e) {
				e.printStackTrace();
			} catch (IOException e) {
				e.printStackTrace();
			}
		}
	}

测试结果

进行评分前，它是长这样的：