昨天粗略的研究了下solr自身的拼写纠错功能,效果不是很好,今天继续研究了其中的依靠文件来纠错和主索引纠错的方式
===================
文件加载方式
配置--
<lst name="spellchecker">
<str name="classname">solr.FileBasedSpellChecker</str>
<str name="name">file</str>
<!--词典文件(solr.home/conf/spellings.txt),为演示先在文件中添加”周杰伦”-->
<str name="sourceLocation">spellings.txt</str>
<str name="characterEncoding">UTF-8</str>
<!--基于spellings.txt文件生成的拼写索引目录-->
<str name="spellcheckIndexDir">./spellcheckerFile</str>
<!-- optional elements with defaults-->
<str name="distanceMeasure">org.apache.lucene.search.spell.LevensteinDistance</str>
<str name="accuracy">0.5</str>
</lst>
<!--spell 查询器 -->
<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="spellcheck.dictionary">file</str>
<str name="spellcheck">on</str>
<str name="spellcheck.extendedResults">true</str>
<str name="spellcheck.collate">true</str>
<str name="spellcheck.collateExtendedResults">true</str>
<str name="spellcheck.count">10</str>
</lst>
<!-- <lst name="defaults">
<str name="spellcheck.dictionary">file</str>
<str name="spellcheck.count">10</str>
</lst>-->
<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>
词典
放置位置:solr.home\meixin_suggest\conf
词典
放置位置:solr.home\meixin_suggest\conf