1、优化匹配
bagofwords通过kmeans聚类可以得到聚类中心,然后每个图像也可以得到直方图,有了直方图之后怎么快速的匹配成为了一个问题。
http://blog.csdn.net/u011563663/article/details/9722805这篇文章中提到了可以用哈希表法,但是这个方法有它致命的缺陷,如果图像集是杂乱无章的,就是由各种各类的图像组成的,那这个方法可以达到一个很好的效果,但是如果图象集的背景是相同的,那么这个方法的效果就很差。原因在于如果背景相同,那么这些图片很有可能某个直方图项都不为0,所以所有图片都挂到了某个哈希表的后面,这时候匹配目标图片就还是的和图片库里面每个图片都要比较,因此哈希表没有起到任何效果。
接下来介绍另外一种思路:
上图所示的是两张图片A,B的直方图,可以考虑,如果两张图片非常相似,那么这两个直方图中相应项同时不为0的概率会很大。我们可以直接统计两个直方图同时相应项不为0的数量,如果大于某个阈值(50、100)的我们才比较,那这样的会cut掉很多图片。
因此得到图像库直方图之后,如果有图片需要比较,将该图像的直方图与图像库的直方图比较,选出至少有同时不为N的图像进行比较,会大大提高匹配的速度。
上图表示1,3,7项同时都不为0,