实战 | 多种方法实现以图搜图

点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:AI 算法与图像处理

概述

以图搜图技术是日常生活中常用的功能,当你看到某张图片某件衣服甚至是某个明星,可能都无须舔着脸问你身边的小伙伴了,因为目前的搜图技术能基本满足你的日常需求。
那么这么有趣又实用的技术,到底如何去实现它呢?

预期目标

之前分享的相对比较麻烦,需要多个操作步骤,最终的显示效果也并不是非常美观。因此今天,我们膨胀了,希望一步到位并让结果更加漂亮哦~

定个小目标:

希望输出下面的结果,最上面一行是query图片(需要查询图片),下面一行输出五个与查询图片最接近的结果。

实施方案

给定一组查询图片和数据库图片。我们对数据库图片执行以图搜图操作,在image embeddings(将图片数据转换为固定大小的特征表示——矢量)上以余弦相似度作为距离度量使用kNN获取前k个最相似的数据库中的图片。

在接下来的例子中,我们提供了36个食物数据库中的图片(每种食物有6张图:牛排、土豆、炸薯条、沙拉、汉堡、芦笋),通过查询3张并未在数据库中出现的测试图片执行图片搜索功能。

链接中的代码已提供爬Google图片的代码以及对图片进行预处理的相关操作

将采用以下两种方法执行以图搜图功能:

1)Transfer learning

2)Training Autoencoders、

Trainsfer learning

通过使用例如预训练模型VGG19生成 image embeddings(可以理解为图片的特征向量) 。这是通过移除VGG199模型最后的基层,并对我们的图片进行维度变换,压缩成一维向量。整个过程无需训练,只需利用预训练模型的权重即可。

下图为整个过程的原理图:


Training Autoencoders

我们在数据库图片上同时训练simple autoencoder 和 convolutional autoencoder ,并使的reconstruction loss 最小。经过充分训练后,我们提取autoencoder的编码器部分,并在推理过程中使用它生成 flattened embeddings。

看了下面这张图也许,能明白一些东西


可视化结果

Transfer Learning

Convolutional Autoencoder

Simple Autoencoder

使用方法

项目结构:再次放一下链接:https://github.com/ankonzoid/artificio/tree/master/image_retrieval

运行程序 image_retrieval.py即可实现我们的上图效果,最终的结果会保存到 新建的output文件中。

我们通过对 image_retrieval.py 中的modelName进行调整,以选择你需要的方法:

这里提供了三种可选模型

modelName = "convAE"  # try: "simpleAE", "convAE", "vgg19"

三种模型的含义:

  • "simpleAE" = simple fully-connected autoencoder

  • "convAE" = multi-layer convolutional autoencoder

  • "vgg19" = pre-trained VGG19 for transfer learning

原文代码中注释的非常清晰了这里就过多解释了

最后注意一下需要的库:

  • tensorflow, skimage, sklearn, multiprocessing, numpy, matplotlib

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: Java实现以图搜图功能的实现主要依赖于图像处理和图像识别技术。 首先,需要使用Java的图像处理库,例如OpenCV或Java Advanced Imaging(JAI),来读取和处理图像。这些库提供了丰富的图像处理函数和算法,可以完成图像的预处理和特征提取等任务。 其次,需要使用机器学习或深度学习算法,来对图像进行特征提取和识别。可以使用Java的机器学习库,例如Weka或TensorFlow,来训练一个图像分类模型。该模型可以使用一组已知的图像样本进行训练,使其能够识别不同类型的图像。 在实际的搜索过程中,用户需要提供一个待搜索的图像。程序将使用同样的图像处理和特征提取算法,对待搜索的图像进行处理,并提取出与已知图像样本相似的特征。 最后,根据待搜索图像的特征与已知图像样本的相似度,可以通过计算两者之间的距离或相似性度量,来进行图像匹配和相似图像的搜索。模型会返回与待搜索图像最接近的已知图像样本,或者返回一组相似度较高的图像。 总结起来,Java实现以图搜图功能需要借助图像处理库和机器学习算法,对图像进行特征提取和识别。用户提供待搜索图像后,程序将对其进行处理,并通过比较特征的相似度,来找到与之最接近或相似的图像。这样可以实现图像的搜索和相似图像的查找。 ### 回答2: Java实现以图搜图功能可以通过以下步骤: 1. 图片特征提取:使用Java图像处理库,如OpenCV或Java Advanced Imaging(JAI),读取输入图像,并提取图像的关键特征,如颜色直方图、纹理特征或边缘特征等。这些特征可以通过计算图像的统计特性或使用深度学习算法进行提取。 2. 图像相似度计算:对于给定的检索图像,计算其与数据库中所有图像的相似度。可以使用Java的相似度计算库,如Apache Commons Math,来计算两个图像特征之间的距离或相似度。常用的相似度度量包括欧氏距离、曼哈顿距离或余弦相似度等。 3. 数据库管理:将图像和其对应的特征值存储在数据库中。可以使用Java的关系型数据库,如MySQL或PostgreSQL,以及相应的JDBC驱动程序进行数据库管理。数据库的设计可以根据实际需求选择合适的表结构,包括图像文件路径、图像特征值等字段。 4. 图像搜索功能:用户输入待搜索图像,并提供图像路径或上传图像文件。程序读取输入图像,并提取其特征值。然后,程序计算输入图像与数据库中所有图像的相似度,找出相似度最高的图像。 5. 结果展示:将搜索结果展示给用户。可以使用Java图形化界面库,如JavaFX或Swing,创建一个用户友好的界面,显示搜索结果,并提供交互功能,如点击结果图像以显示详细信息、保存结果等。 总结起来,Java实现以图搜图功能主要涉及图像处理、特征提取、相似度计算、数据库管理和图形化界面等方面。这需要使用Java的图像处理库和相关算法,以及数据库和图形化界面的相关技术,结合数据库设计和Java编程知识来实现

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值