Elasticsearch Analyzer(分词器介绍)

最新推荐文章于 2024-04-28 13:17:57 发布

yutanbo123

最新推荐文章于 2024-04-28 13:17:57 发布

阅读量573

点赞数

分类专栏： elasticsearch 文章标签： elasticsearch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yutanbo123/article/details/119207635

版权

本文介绍了Elasticsearch的文本分析过程，重点讲解Analyzer如何处理分词，包括内置的Standard、Simple、Whitespace、Stop、Keyword和Pattern Analyzer，以及Language Analyzer和自定义的ICU-Analyzer。还提到了中文分词的挑战，并推荐了IK和THULAC两个中文分词器。

摘要由CSDN通过智能技术生成

Elasticsearch Analyzer

前言
Analyzer
更多中文分词器
总结

前言

Analysis：文本分析是把全文本转换成一系列单词(term/token)的过程，也叫分词。Analysis 是通过 Analyzer 来实现的，可以使用 ES 内置的分析器，也可使用定制的分析器。在写入数据和查询数据的时候，都需要用相同的分析器对语句进行分析。

Analyzer

Analyzer 分词器是专门处理分词的组件，由三部分组成：Character Filters(处理原始文本，例如去除html、特殊字符)、Tokenizer(按照规则切分为单词)、Token Filters(将切分的单词加工，小写、删除 stopwords(停用词)，增加同义词)。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch Analyzer(分词器介绍)

Elasticsearch Analyzer前言Analyzer更多中文分词器总结前言Analysis：文本分析是把全文本转换成一系列单词(term/token)的过程，也叫分词。Analysis 是通过 Analyzer 来实现的，可以使用 ES 内置的分析器，也可使用定制的分析器。在写入数据和查询数据的时候，都需要用相同的分析器对语句进行分析。AnalyzerAnalyzer 分词器是专门处理分词的组件，由三部分组成：Character Filters(处理原始文本，例如去除html、特殊字符)
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。