在做项目的时候 对类似于 这种标签进行分词处理的时候
建筑,摄影,机械,IT,旅游
ik分词器会自动将IT过滤,导致查询IT的时候无法查询相关文档
如何解决,重新定义分词规则,可以按照逗号 “,”来分词 将词分为
建筑
摄影
机械
IT
旅游
效果如下
GET shenbioffice_1/doc/174629/_termvectors?fields=goods_tag
实现方式:创建索引的时候重新定义分词规则
"settings": {
"index": {
"number_of_shards": "1",
"number_of_replicas": "1"
},
"analysis": {
"analyzer": {
"comma": {
"type": "pattern",
"pattern":","
}
}
}
}
在需要分词的字段加入如下设置
"goods_tag": {
"type": "text",
"analyzer": "comma",
"search_analyzer": "comma"
},
就可以实现插入时按照逗号分词