ElasticSearch-PHP:自定义分词规则 Mappings的创建

最新推荐文章于 2024-01-21 03:33:40 发布

积累是金

最新推荐文章于 2024-01-21 03:33:40 发布

阅读量2.6k

点赞数

分类专栏： ElasticSearch 文章标签： Elasticsearch ES Elasticsearch-PHP

本文链接：https://blog.csdn.net/yw5201314/article/details/52856387

版权

ElasticSearch 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

由于项目索引的数据格式，综合优化的考虑决定自定义ES的分词格式。

例如项目的存储的数据可能是 a=1&a=2&b=3&c=4

检索的时候带过来的条件： a=2 , b=3

所以完全可以按照 “&” 符号来分词，把类似 “a=1”这样的数据当作是一个词

创建索引的时候按照这个规则分词并索引，

查询的时候把条件也这样拆分再来查询匹配

以下就是创建这样一个mapping的代码:

public function createAnalysis(){
        $index_params=[
            'index'=>'test_index',//需要被设置的索引名
            'body'=>[
                'settings'=>[
                    'analysis'=>[
                        'analyzer'=>[
                            'my_analyzer'=>[
                                'tokenizer'=>'my_tokenizer'
                            ]
                        ],
                        'tokenizer'=>[//定义分词规则
                            'my_tokenizer'=>[
                                'type'=>'pattern',
                                'pattern'=>'&' //按照指定的符号分词
                            ]
                        ],
                    ]
                ],
                'mappings'=>[
                    'ad_type_test'=>[ //被设置的索引的TYPE
                        'properties'=>[
                            'tags'=>[ //被设置的索引中_source中的字段
                                'type' =>"string",
                                'analyzer'=>'my_analyzer',//设置创建索引的时候按照定义的分析格式分词
                                'search_analyzer'=>'my_analyzer'//设置查询的条件也按照定义的分词格式分词
                            ]
                        ]
                    ]
                ]
            ]
        ];
        $this->esClient->indices()->create($index_params);//执行创建
    }