ES自定义分词,对数字进行分词,小数点也进行拆分
我们使用的Unicode进行正则匹配,Unicode将字符编码分为了七类,其中P代表标点L 代表字母Z 代表分隔符(空格,换行)S 代表数学符号,货币符号M代表标记符号N 阿拉伯数字,罗马数字C其他字符例如:所以\pP的作用是匹配中英文标点,比如, . > 》?,而\pS代表的是数学符号,货币符号等#自定义分词器},"name": {},},"punctuation_analyzer":{// 分词器的名字"type":"custom", //类型是自定义的。
原创
2023-07-27 16:16:15 ·
1467 阅读 ·
0 评论