Elasticsearch 分词搜索

最新推荐文章于 2024-09-20 22:32:38 发布

ludizhang

最新推荐文章于 2024-09-20 22:32:38 发布

阅读量691

点赞数

分类专栏： elasticsearch 文章标签：大数据开发工具 c/c++

本文链接：https://blog.csdn.net/ludizhang/article/details/84819358

版权

elasticsearch 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

之前做了一下ES 的分词搜索，在网上找的资料很少，只能根据API一点点扒拉，总算长得帅还是有好处的，成功的通过分词进行搜索，适用的场景，根据某些字段进行分词匹配，并指定字段不同的优先级，都是通过http请求直接完成，自己实现是通过java封装了一下，java代码就不贴出来了，大家可以根据根据自己需要进行封装
分词查询大概需要两步操作：1.设置ES 某index下的mapping，2，针对字段进行query搜索

前提是先安装ES的分词插件，参考地址：http://ludizhang.iteye.com/blog/2323939

1.[b][i]设置index mapping [/i][/b]
向ES发送http [color=red]PUT[/color]请求，
url：http://ip:port/indexName
postBody :


 {
    "mappings": {
        "testBase2": {
            "properties": {
                "field1": {
                    "type": "string",
                    "index": "analyzed",
                    "analyzer": "ik",
                    "search_analyzer": "ik",
                     "store":"yes"
                },
               "field1": {
                    "type": "string",
                    "index": "analyzed",
                    "analyzer": "ik",
                    "search_analyzer": "ik",-- 指定分词器
                    "store":"yes"
              } 
            }
        }
    }
}

怎么判断设置成功了呢，可以参考[img]

[img]http://dl2.iteye.com/upload/attachment/0120/2926/a87013af-4459-31e5-aaad-4df1f2831f29.png[/img]

[/img]

在那黑框中有mapingg信息，不是setting里面的mapping哦，而是直接一个mapping节点，
同时图片中的页面是基于ES的_plugin/head/插件的

[i][b]2.分词查询向ES 发送查询的POST请求[/b][/i]

url：http://ip:port/indexName/typeName/_search


{
    "query": {
        "bool": {
            "must": [
                {
                    "query_string": {
                        "analyzer": "ik",-- 分析器，基于IK分词
                        "default_field": "field1",-- 查询字段
                        "query": "中国和美国",-- 匹配内容
                        "boost": 6 -- 查询权重
                    },
                    "query_string": {
                        "analyzer": "ik",
                        "default_field": "field2",
                        "query": "中国和美国",
                        "boost": 4
                    }
                }
            ]
        }
    },
"size": 10,-- 分页设置，每页条数
"from": 0-- 开始索引
}

查询结果
{
"took": 7,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 4,-- 总条数
"max_score": 1,
"hits": [
{
"_index": "index",
"_type": "testBase2",
"_id": "3187",
"_score": 1,
"_source": {
"brandName": "test5",
"classifyId": 23,
"labelWord": "标签3",
"videoName": "投放两段，9-12,14-16",
"brandId": 6,
"videoDesc": "视频简介5",
"videoId": 3187,
"classifyName": "生活aa",
"keyWord": "关键4"
}
},
....
]
}
}

********************* 更新，用更加简单发方式进行复杂的查询


{
"fields": ["videoName","videoDesc"],//指定返回的字段
    "query": {
        "bool": {
            "must": [
                {
                    "query_string": {
                        "fields": ["videoName^9","videoDesc^1"],//查询字段+权重
                         "analyzer": "ik",
                        "query": "解决方式"
                    }
                }
            ]
        }
    },"from": 0, "size": 60
}

返回的结果和上一个查询方法返回的格式差不多，区别在于我们的这个查询是指定字段查询在
返回的数据部分


{
    "took": 38,
    "timed_out": false,
    "_shards": {
        "total": 5,
        "successful": 5,
        "failed": 0
    },
    "hits": {
        "total": 2444,
        "max_score": 1,
        "hits": [
            {
                "_index": "index",
                "_type": "testBase2",
                "_id": "1230",
                "_score": 1,
                "fields": {
                    "videoName": [
                        "一路向北"
                    ],
                    "videoDesc": [
                        "开辆奔驰，一路向北。在每条路上，玩的是乐趣，若能变换自如，我必飞奔到底。|奔驰"
                    ]
                }
            }
        ]
    }
}