solr入门之拼写纠错深入研究及代码Demo

本文详细研究了Solr的DirectSolrSpellChecker,通过编辑距离度量匹配,探讨了accuracy、maxEdits等参数对拼写纠错的影响。在测试中发现,对于中文域,使用原生态的字符串域类型可以获得更好的效果。同时,文章提供了相关参考资料以供深入学习。
摘要由CSDN通过智能技术生成

昨天粗略的研究了下solr自身的拼写纠错功能,效果不是很好,今天继续研究了其中的依靠文件来纠错和主索引纠错的方式

===================

文件加载方式

配置--
  <lst name="spellchecker">
   <str name="classname">solr.FileBasedSpellChecker</str>
   <str name="name">file</str>
   <!--词典文件(solr.home/conf/spellings.txt),为演示先在文件中添加”周杰伦”-->
   <str name="sourceLocation">spellings.txt</str>
   <str name="characterEncoding">UTF-8</str>
   <!--基于spellings.txt文件生成的拼写索引目录-->
   <str name="spellcheckIndexDir">./spellcheckerFile</str>

    <!-- optional elements with defaults-->
    <str name="distanceMeasure">org.apache.lucene.search.spell.LevensteinDistance</str>
    <str name="accuracy">0.5</str>

 </lst>

  <!--spell 查询器 -->
  <requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">  
    <lst name="defaults">  
      <str name="spellcheck.dictionary">file</str> 
      <str name="spellcheck">on</str>  
      <str name="spellcheck.extendedResults">true</str>              
      <str name="spellcheck.collate">true</str>  
      <str name="spellcheck.collateExtendedResults">true</str>
      <str name="spellcheck.count">10</str>      
    </lst> 
    <!--  <lst name="defaults">
          <str name="spellcheck.dictionary">file</str>
          <str name="spellcheck.count">10</str>
      </lst>-->
    <arr name="last-components">  
      <str>spellcheck</str>  
    </arr>  
  </requestHandler>
词典
放置位置:solr.home\meixin_suggest\conf
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值