由于项目索引的数据格式,综合优化的考虑 决定自定义ES的分词格式。
例如 项目的存储的数据可能是 a=1&a=2&b=3&c=4
检索的时候带过来的条件: a=2 , b=3
所以完全可以按照 “&” 符号来分词,把类似 “a=1”这样的数据当作是一个词
创建索引的时候按照这个规则分词并索引,
查询的时候把条件也这样拆分 再来查询匹配
以下就是创建这样一个mapping的代码:
public function createAnalysis(){
$index_params=[
'index'=>'test_index',//需要被设置的索引名
'body'=>[
'settings'=>[
'analysis'=>[
'analyzer'=>[
'my_analyzer'=>[
'tokenizer'=>'my_tokenizer'
]
],
'tokenizer'=>[//定义分词规则
'my_tokenizer'=>[
'type'=>'pattern',
'pattern'=>'&' //按照指定的符号分词
]
],
]
],
'mappings'=>[
'ad_type_test'=>[ //被设置的索引的TYPE
'properties'=>[
'tags'=>[ //被设置的索引中_source中的字段
'type' =>"string",
'analyzer'=>'my_analyzer',//设置创建索引的时候按照定义的分析格式分词
'search_analyzer'=>'my_analyzer'//设置查询的条件也按照定义的分词格式分词
]
]
]
]
]
];
$this->esClient->indices()->create($index_params);//执行创建
}