zz from:http://hi.baidu.com/lszhuhaichao/blog/item/a9ceff16df8ef64620a4e98b.html
基于Lucene平台的CBIR系统研究—开篇
Lucene平台已经研究了很长时间,虽说有不少细节的东西还没有解决,但是基本的应用已经没有什么问题了。所以开始做CBIR的东西了。
所谓的CBIR就是Content-Based Image Retrieval 的英文缩写,中文名就是基于内容的图像检索。
Lucene只是一个全文检索的平台,我们可以很容易地在这个平台上实现关键字的检索,但是如何实现基于内容的图像检索呢?今天,在这里首先介绍一下Lucene Image Retrieval(LIRe)这个平台,并在以后的文章当中和大家分享有关LIRe学习的心得,可能在这过程当中会插入我的相关工作的内容。
LIRe的主页是http://www.semanticmetadata.net/,下图是这个主页的截图。
就像Lucene平台是一个全文检索的开源的Java库一样,LIRe也是一个开源的Java库,只是它提供的API是用于基于内容的图像的检索的,可以实现对图像的特征提取和建立索引。由于LIRe是在Lucene的基础上开发的,在2006年2月份发布了第一个版本,目前最高的版本是v0.8。LIRe是作为Caliph & Emir的子项目,在SourceForge上可以下载。网址为:
http://sourceforge.net/projects/caliph-emir/
在这里插入一些有关Caliph & Emir的内容。Caliph & Emir是基于Java的用于图像的文本标识和检索的。它实现了大部分的MPEG-7的特征。而且,Caliph & Emir 是目前已知的唯一提供MPEG-7的开源库。其中Caliph是用于对图像进行文本标识和元数据提取的。它支持四种MPEG-7的颜色特征:颜色布局特征(Color layout),可扩展颜色(Scalable color),边缘直方图(Edge Histogram)和主色(Dominant color)。Emir是用于检索的。其主要支持Caliph的颜色特征的基于内容的图像检索和基于文本的检索。
在回过头来继续讲讲LIRe,在LIRe中主要实现的图像特征有:
1. RGB和HSV空间的颜色直方图;
2. MPEG-7的颜色特征,包括Scalable color,Color layout和Color layout;
3. Tamura纹理特征,包括粗糙度(Coarseness),对比度(Contrast)和方向度(Directionality);
4. 颜色和边缘的方向性描述符(Color and edge directivity descriptor, CEDD);
5. 模糊颜色和纹理直方图(Fuzzy color and texture histogram, FCTH);
6. 颜色关联图(Auto color correlation);
7. 尺度不变特征变换(Scale-invariant feature transform , SIFT)。
小结:LIRe是一个轻量型的CBIR的API库。由于其是在Lucene的基础上开发的,并且是属于Caliph & Emir项目的一部分,因此LIRe在一方面实现了对图像的特征提取,另一方面摆脱了传统的基于数据库的线性查找的方式。我们可以在这个平台上比较容易的实行轻量级的图像检索。