【Elasticsearch】文本分析 Text analysis (1)

Text analysis 是什么

Text analysis 是将分结构化文本转化成结构化文本的过程。

触发时机

索引或者搜索text类型字段,就会触发文本分析。

工作流程

1.字符过滤器

字符过滤器是对原始文本的处理,比如转换文字编码,过滤网页元素等。

2.令牌生成器

令牌生成器将字符过滤器处理之后的字节流进行处理,得到令牌(tokens)。

分析器必须有且仅有一个令牌生成器。

3.令牌过滤器

令牌过滤器接收令牌生成器返回的令牌流,再做一些处理。

令牌过滤器不允许更改每个令牌的位置或字符偏移量。

分析器可能具有零个或多个按顺序应用的令牌过滤器。

参考资料

  • https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis.html#analysis
雨果虾滑猫 CSDN认证博客专家 PHP MySQL Python
CSDN博客专家。PHP/MYSQL/Elasticsearch,PMP项目管理 ,产品设计。6年服务端开发,2年产品,连续创业者,曾经参与区块链、新零售行业创业。Gitchat作者,曾在Gitcchat发布智能合约相关课程。
相关推荐
©️2020 CSDN 皮肤主题: 博客之星2020 设计师:CY__ 返回首页
实付 19.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值