实训项目：以图搜图

最新推荐文章于 2024-08-02 11:22:40 发布

richlaji

最新推荐文章于 2024-08-02 11:22:40 发布

阅读量2.3k

点赞数 2

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/richlaji/article/details/48324757

版权

本文介绍了以图搜图的实训项目，通过抓取京东女包数据，使用Caffe训练模型抽取特征，进行ITQ压缩，并采用MIH建立哈希表，实现快速图像匹配。实训过程包括数据抓取、模型训练、特征抽取、ITQ与MIH技术应用，以及实训感想。

摘要由CSDN通过智能技术生成

以图搜图

一个运用机器学习来搜女包的项目，以下是项目过程介绍&个人感想

一、实训简介

　　这次大三为期一个半月的实训，我参与的实训项目是做的是一个以图搜图的应用，用的是京东上的女包的数据。考虑到这样的一个场景，在网上浏览网页的时候遇到喜欢的包包，但是在电商网站的搜索栏中难以用语言描述出来，所以我们提供一个以图搜图的应用，以图片代替语言的形式，在某些语言难以描述清楚的情况下，帮助客户快速、准确找到想要的商品。

我们做这款应用的大概流程是：
>
- 从京东网站上抓取图片和文本数据
2. 利用caffe训练的模型抽取特征
3. 把抽取到的特征压缩成二进制码
4. 建立分段哈希表

然后客户传入图片数据，经过特征抽取和压缩成二进制码，再与分段哈希表中的数据做比较，找到相似的女包后，应用会返回电商的链接。

二、实训项目流程

1.抓取&分析数据

　　实现以图搜图的功能首先需要获得训练数据，需要抓取包包的图片和标签信息。使用了Python的Request库，我这里抓取的是京东的数据，主要考虑以下几个原因：
>
- 京东的商品比较多，适合用于需要大数据量的机器学习训练
- 京东的标签比较齐全，方便我们训练时候标签的筛选
- 京东的分类的商品格式比较规范，便于我们抓取

　　抓取数据完数据之后需要对数据所在的网页进行分析，提取出我们需要的信息，这里用到了Python的BeautifulSoup的库。BeautifulSoup的库会把html网页

最低0.47元/天解锁文章

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

richlaji CSDN认证博客专家 CSDN认证企业博客

码龄10年

73: 原创

27万+: 周排名

178万+: 总排名

4万+: 访问

: 等级

1145: 积分

5: 粉丝

8: 获赞

7: 评论

13: 收藏

私信

关注

热门文章

分类专栏

JAVA 7篇
Ubuntu 5篇
Haskell
Soj 6篇
算法 6篇
机器学习 3篇
其他 9篇
数据结构 4篇
iOS 5篇
LeetCode 21篇
Shell 7篇
OpenGL

最新评论

Winsock网络编程
weixin_52151160: 为啥运行客户端显示不能和服务器连接，怎么将两个连接
实训项目：以图搜图
小绒哥[绒传奇]: 我们正在做相关的项目，有兴趣联系我
Ubuntu Sublime安装Source Code Pro字体
richlaji: 如果是其他系统的话，http://www.adobe.com/products/type/install-instructions.html有安装说明，其中Win7和Win8就是下载了github的之后，直接右键安装字体即可，特别简单
双硬盘Win8.1安装EFI引导的Ubuntu
richlaji 回复 C_chot: 你看看你分区表是MBR还是GPT的，我这里说的是GPT的，我之前有一台电脑是win7的就不是这么装的。虚拟机也有虚拟机的好处，玩坏了也不怕
双硬盘Win8.1安装EFI引导的Ubuntu
C_chot: 我的笔记本一个 ssd（C）然后一个机械的划分为defg想装双系统一个win7+centos 。win7在c盘 (ssd)，然后centos装在机械硬盘。我试了好几次没成功，最后用VMware里面装的centos。用起来还是没真机方便。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。