使用elasticSearch搭建本地以图搜图服务

使用elasticSearch的向量检索实现以图搜图

前言

项目地址:https://github.com/xjhqre/sis/tree/v1.0

搭建本地以图搜图服务文章中实现了以图搜图,但还是存在一些问题,程序启动时需要加载大量的特征文件到内存中,每次程序启动时都需要花上十几分钟。

而在使用elasticSearch实现以图搜图文章中使用了elasticsearch来检索图片的描述。但是精准度不高,而且图片的训练速度有点慢

于是我想直接把特征数组直接存入elasticsearch来做检索。于是我查了一下elasticsearch能否存储向量数据,刚好找到了dense_vector这个数据结构,并且elasticsearch也提供了几种算法来计算向量之间的相似度。

快速开始

安装elasticsearch和kibana

需要注意dense_vector向量数据结构是在elasticsearch7.2版本之后加入的。

安装步骤可以直接看我的这篇文章全文检索-ElasticSearch里的docker安装目录

创建索引

在kibana里创建索引

# 创建索引结构
PUT imgsearch
{
  "mappings": {
    "properties": {
      "feature": {
        "type": "dense_vector",
        "dims": 1024
      },
      "url": {
        "type": "keyword"
      },
      "name": {
        "type": "keyword"
      }
    }
  }
}

其他的命令:

# 删除索引数据
DELETE imgsearch

# 查询索引数据
GET imgsearch/_search

# 查询索引
GET imgsearch

下载项目

https://github.com/xjhqre/sis/tree/v1.0

项目里有三个主要文件:

  • config.py:修改配置
  • offline.py:提取图片特征保存到elasticsearch
  • server_oss.py:启动web服务检索图片

1、修改elasticsearch配置,将以上两个文件里的elasticsearch的IP地址改为自己的

image-20220724150926368

2、修改两个文件中的图片路径,我的图片是放在OSS上的。可以把地址修改为./static/img/

image-20220724151101511

image-20220724151247408

3、运行offline.py文件查看elasticsearch是否存入数据

4、若以上步骤无误后启动server_oss.py,访问http://localhost:5000/即可

效果展示

image-20220724151940976

总结

优点:

  1. 不需要.npy文件
  2. 程序秒启动
  3. 图片检索速度快
  4. 特征数据备份方便,只需要备份elasticsearch的索引

缺点:

  1. 图片检索准确度可能会有所降低,因为elasticsearch的dense_vector数据结构最多支持的数组大小为1024。而图片提取的特征尺寸为4096,对特征数组做了切片

参考资料

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
### 回答1: Elasticsearch集群搭建是指在多台服务器上安装和配置Elasticsearch,使它们能够协同工作以提供更高的可用性和性能。搭建Elasticsearch集群需要考虑多个方面,包括节点配置、数据分片、负载均衡等。具体步骤包括安装Java、安装Elasticsearch、配置节点、配置数据分片、配置负载均衡等。在搭建过程中需要注意一些细节,如节点之间的通信、数据备份和恢复等。 ### 回答2: Elasticsearch是一个开源的分布式搜索和分析引擎。它是基于Lucene库的,并且提供了一个RESTful API对外提供服务,可以在大数据量环境下,快速,准确地检索和分析数据。 Elasticsearch可以集群化部署,以实现数据的高可用和水平扩展。一个Elasticsearch集群通常由多个节点组成,节点可以运行在不同的物理机器或虚拟机器上。节点之间互相通信,协作完成数据的索引和查询。 以下是关于如何搭建Elasticsearch集群的简单介绍: 1. 安装Java环境 Elasticsearch基于Java开发,所以需要安装Java环境。建议使用OpenJDK 8或者Oracle JDK 8。 2. 下载并解压缩ElasticsearchElasticsearch官网下载最新版本的软件包,解压缩到您计划使用的目录,例如"/usr/share/elasticsearch"。 3. 配置Elasticsearch节点 在每个节点上设置Elasticsearch节点配置。其中一个最重要的配置是“cluster.name”,每个节点必须将其设置为相同的名称来加入同一个集群。 4. 配置群集发现 群集发现的主要功能是检测新加入或退出群集中的节点。Elasticsearch使用多种发现方法,如多播、单播、EC2自动发现等等。一般地,多播方式不太可靠,建议使用单播等有保障的方式。 5. 启动Elasticsearch节点 在每个节点上启动Elasticsearch进程。通过访问"http://localhost:9200"可以检查Elasticsearch是否已经成功启动。 6. 配置索引和shard副本 Elasticsearch通过将数据分割成多个索引、分片以及副本来实现水平扩展和高可用性。索引和shard参数的设计需要根据实际需求来确定。 7. 安全配置 在集群环境下,安全配置是非常必要的。主要的安全措施包括传输层安全性、节点访问控制、访问审计等等。最好参考官方文档来设置安全措施。 上述步骤仅是一个简单的概述,Elasticsearch集群搭建还需要考虑到具体的应用需求、硬件资源、数据量和查询性能等方面。建议在实际操作中进行详细研究和调整。 ### 回答3: Elasticsearch是当今最流行的搜索引擎之一,它具有高效、稳定和可扩展等优点,并且广泛应用于各种企业应用程序中。部署Elasticsearch集群不仅可以提高搜索速度和搜索质量,而且仍然可以提供可靠性和冗余性,以保障整个集群的高可用性。本文将讨论如何搭建Elasticsearch集群。 搭建Elasticsearch集群的前置条件是已经拥有多台服务器,具备以下要求: 1. 操作系统:Linux、Windows等 2. JDK版本:1.8及以上 3. Elasticsearch版本:7.x 4. 硬件要求:主机内存可以根据实际情况进行调整,但是最好不要低于4GB。 5. 硬盘要求:建议每台服务器都有一块专门用于存储数据的硬盘,以便于管理和备份。 6. 网络要求:每台服务器都需要分别配置一个IP地址,以便于节点相互通信和集群的建立。 下面具体讲解如何搭建Elasticsearch集群: 第一步:安装JDK环境 Elasticsearch是基于Java语言开发的,因此需要安装JDK环境。安装完成后,通过运行java -version 命令来检查JDK环境是否安装成功。 第二步:安装Elasticsearch 可以从Elasticsearch官网下载最新版本的安装包压缩包。下载完成后,使用解压命令将其解压到任意目录下。 第三步:配置Elasticsearch 每台服务器的配置都包括以下关键参数: cluster.name:集群的名称,因为每个节点都只能加入到同一个集群之中,所以集群名称必须一致。 node.name:节点的名称,每个节点都需要有唯一的名称标识,以便于集群管理和监控。 network.host:设置节点的IP地址,在多台服务器中,每个节点都需要拥有一个唯一的IP地址。 第四步:设置集群节点 节点具有容错性和冗余性,在Elasticsearch集群中至少需要2个节点。建议将节点分配在不同的服务器上,以便于在故障时可以再次启动其他节点来覆盖故障节点。 节点之间相互交换有关集群的信息,通过访问任何一个节点,都可以获得有关整个集群的信息。 第五步:优化集群性能 为了提高整个集群的性能,我们需要设置Elasticsearch的Java虚拟机(JVM)参数,这将有助于提高集群吞吐量、降低请求延迟、减少垃圾收集时间等。 例如,可以调整Xms和Xmx这两个参数来控制Java虚拟机使用的内存,以达到优化集群性能的目的。 总结 在本文中,我们简单介绍了如何在多台服务器上搭建Elasticsearch集群。具体而言,我们需要完成安装JDK、安装Elasticsearch、配置Elasticsearch、设置集群节点和优化集群性能等步骤。如果您在集群搭建过程中遇到了问题,可以参考Elasticsearch的官方文档或者社区贡献者的博客。通过合理设置,可以为整个集群提供高效、稳定、可扩展的搜索服务

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

xjhqre

你的鼓励将是我创作的最大动力

¥2 ¥4 ¥6 ¥10 ¥20
输入1-500的整数
余额支付 (余额:-- )
扫码支付
扫码支付:¥2
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值