![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
IK分词器
荒--
这个作者很懒,什么都没留下…
展开
-
IK分词器细粒度的拆分
一、ik_max_word:会将文本做最细粒度的拆分,例如「中华人民共和国国歌」会被拆分为「中华人民共和国、中华人民、中华、华人、人民共和国、人民、人、民、共和国、共和、和、国国、国歌」,会穷尽各种可能的组合二、ik_smart:会将文本做最粗粒度的拆分,例如「中华人民共和国国歌」会被拆分为「中华人民共和国、国歌」返回结果如下:{ "tokens": [ { ...原创 2020-02-21 16:06:19 · 4059 阅读 · 1 评论 -
配置IKAnalyzer扩展词库
在Elasticsearch的安装目录下找到文件IKAnalyzer.cfg.xml,内容如下:<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties> <co原创 2019-01-10 16:45:18 · 2787 阅读 · 0 评论