ES dense_vector 计算余弦相似度

最新推荐文章于 2024-08-20 10:05:50 发布

runing_an_min

最新推荐文章于 2024-08-20 10:05:50 发布

阅读量2.2k

点赞数 1

分类专栏： # elasticsearch 文章标签： elasticsearch function_score 向量余弦

本文链接：https://blog.csdn.net/u014686399/article/details/122542887

版权

elasticsearch 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

先上查询语句

{
    "from": 0,
    "size": 100,
    "query": {
        "function_score": {
            "query": {
                "bool": {
                    "filter": [
                        {
                            "term": {
                                "data_type": "wl"
                            }
                        }
                    ],
                    "must": {
                        "match": {
                            "long_desc": "金属"
                        }
                    }
                }
            },
            "script_score": {
                "script": {
                    "source": f"cosineSimilarity(params.queryVector, doc['data_vector'])+1.0",
                    "params": {
                        "queryVector": [0,1,2,3]
                    }
                }
            }
        }
    }
}

解释：

对于每个文档，先使用query查询出文档，然后再通过余弦相似度计算出一个分数，最终得分是余弦分数*query的得分，如果想改变这个行为，可以参考官网function score query中的boost_mode参数
data_vector这是我自己索引中的字段，你应该改为你索引中向量字段的名字
queryVector这个就是向量的值，维度要和mapping中定义的一样
至于为什么+1, 官网中也说了，是为了防止得到负数，因为得到负数，ES会抛出错误

runing_an_min

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ES dense_vector 计算余弦相似度

先上查询语句{ "from": 0, "size": 100, "query": { "function_score": { "query": { "bool": { "filter": [ { "term": {
复制链接

扫一扫

专栏目录