以下三种Character Filter是elasticsearch官方提供的三种,(只有三种哦!)
Mapping Char Filter
通过给定的mappings数据来替换.
| mappings数据. |
| 一个存放mappings数据的地址,可以把mappings数据写到config配置文件中,然后把 config存放到某个路径下 |
HTML Strip Char Filter
html_strip
把数据中的html 标签元素剥离出来。例如“<a>”就会变成“a
Pattern Replace Char Filter
pattern_replace
用正则表达式的方式来替换数据。 pattern
正则表达式“参数” replacement
最后替换后的形式。借鉴了lucene的相关内容,详情请参考:http://lucene.apache.org/core/4_3_1/analyzers-common/org/apache/lucene/analysis/pattern/PatternReplaceCharFilter.html
书写格式:
例子:
1、元数据:"aa bb aa bb" 、pattern="(aa)\\s+(bb)"、 replacement="$1#$2"
输出结果为:"aa#bb aa#bb"
2、元数据:"aa123bb" 、pattern="(aa)\\d+(bb)" 、 replacement="$1 $2"
输出结果为:"aa bb"