1.概述
官网:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-charfilters.html
1.1 字符过滤器
字符过滤器用于在将字符流传递给标记器之前对其进行预处理。
字符过滤器以字符流的形式接收原始文本,并可以通过添加、删除或更改字符来转换流。例如,字符过滤器可用于将印度-阿拉伯数字 (٠ ١٢٣٤٥٦٧٨ ٩ ) 转换为它们的阿拉伯-拉丁数字 (0123456789),或<b>从流中去除 HTML 元素等
。
Elasticsearch 有许多内置的字符过滤器,可用于构建 自定义分析器。
1.2 html_strip字符过滤器
该html_strip字符过滤带出HTML元素,比如<b>像和解码HTML实体&。
1.3 映射字符过滤器
该Mapping Character 过