修改ES默认分词设置

最新推荐文章于 2023-06-11 22:43:22 发布

攻城狮阿楠

最新推荐文章于 2023-06-11 22:43:22 发布

阅读量2.7w

点赞数 5

分类专栏：数据检索文章标签： ES默认分词

本文链接：https://blog.csdn.net/tclzsn7456/article/details/79957545

版权

数据检索专栏收录该内容

12 篇文章 0 订阅

订阅专栏

ES的默认分词设置是standard，这个在中文分词时就比较尴尬了，会单字拆分，比如我搜索关键词“清华大学”，这时候会按“清”，“华”，“大”，“学”去分词，然后搜出来的都是些“清清的河水”，“中华儿女”，“地大物博”，“学而不思则罔”之类的莫名其妙的结果，这里我们就想把这个分词方式修改一下，于是呢，就想到了ik分词器，有两种ik_smart和ik_max_word。

ik_smart会将“清华大学”整个分为一个词，而ik_max_word会将“清华大学”分为“清华大学”，“清华”和“大学”，按需选其中之一就可以了。

修改默认分词方法(这里修改school_index索引的默认分词为：ik_max_word)：

PUT /school_index
{
    "settings" : {
        "index" : {
            "analysis.analyzer.default.type": "ik_max_word"
        }
    }
}

攻城狮阿楠

关注

5
点赞
踩
16

收藏

觉得还不错? 一键收藏
2
评论
修改ES默认分词设置

ES的默认分词设置是standard，这个在中文分词时就比较尴尬了，会单字拆分，比如我搜索关键词“清华大学”，这时候会按“清”，“华”，“大”，“学”去分词，然后搜出来的都是些“清清的河水”，“中华儿女”，“地大物博”，“学而不思则罔”之类的莫名其妙的结果，这里我们就想把这个分词方式修改一下，于是呢，就想到了ik分词器，有两种ik_smart和ik_max_word。 ...
复制链接

扫一扫

专栏目录