Lucene-分词器

  1. 分词器概念
    分词器指的是搜索引擎如何使用关键字进行匹配,如 入门 中的关键字:护眼带光源。 如果使用like,那么%护眼带光源%,匹配出来的结果就是要么全匹配,要不都不匹配。
    而使用分词器,就会把这个关键字分为 护眼,带,光源 3个关键字,这样就可以找到不同相关程度的结果了。
  2.  IKAnalyzer6.5.0.jar
    IKAnalyzer 这个分词器很久都没有维护了,也不支持Lucene7。 IKAnalyzer6.5.0.jar 这个是修改之后的的,可以支持Lucene7的jar, 在右上角下载(已经包含在右上角的lucene.rar中了)。
  3.  代码演示 TestAnalyzer
    如代码所示,使用IKAnalyzer 中文分词器就会把 护眼带光源 分为这么如图所示的3个小关键字进行匹配

    public class TestAnalyzer {
     
        public static void main(String[] args) throws IOException {
             
            IKAnalyzer analyzer = new IKAnalyzer();
            TokenStream ts= analyzer.tokenStream("name", "护眼带光源");
            ts.reset();
            while(ts.incrementToken()){
                System.out.println(ts.reflectAsString(false));
            }
        }
    }














评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值