以图搜图技术与simhash算法.md

背景

以图搜图是很有颠覆力的应用,俗话说一图胜千言
不同于文本搜索的匹配模式,以图搜图要对搜索的信息源进行处理,抽取特征信息。在网易存证系统的开发过程中调研了用于以图搜图的simhash算法,并设想在内容系统建设完善后可以用于诸多的场景,比如:

  • 商业图片侵权自动取证

  • 肖像内容的识别

  • 家庭照片按场景自动分类


图片指纹比较 simhash算法

阮一峰博客 相似图片搜索的原理

  • 压缩大小

  • 压缩颜色

  • 计算平均灰度值

  • 每个像素和平均值比较,大的为1;小的为0,进一步向量化

  • 得出向量,就是图片指纹,

  • 计算汉明距离 hamming distance

如上过程的java实现

通过如上粗粒度的算法分析,可知simhash和普通hash算法有较大不同;普通hash算法是对字节流无差别的处理,但是simhash首先会对信息抽取特征值,然后计算汉明距离,最后这步是关键,度量了两个特征量的相似性&#

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值