初识“图像检索”
2015-9-6~2015-9-11
一周工作内容概要:
- 图像检索课题的文献调研
- 了解有关图像检索的基本概念
- 熟悉图像检索的一般算法处理流程
- 图像检索领域相关学习资源的搜集
明细:
1.文献调研
① 《Content Based Image Retrieval usingColor and Texture》 ManimalaSingha and K.Hemachandran Dept. Of Computer Science, Assam University, SilcharIndia Signal &Image Processing: An International Journal.
② 《Content Based Image Retrieval:Review of State of Art and Future Directions》 Mourad Oussalah University of Birmingham, Electronics, Electricaland Computer Engineering.
③ 《Content Based Image Retrieval UsingSymbolic Processing》 Manimala Singha, Assam University, Silchar Doctoral thesis.
④ 《Medical Image Retrieval System forDiagnosis of Brain Tumor Based on Classification and Content Similarity》 Megha.P.Arakeri, G.Ram MohanaReddy, Department of Information Technology National Institute of Technology,Karnataka, Surathkal, Mangalore, India.
2.基本概念整理
基于文本的图像检索技术:回避对图像可视化元素的分析,从图像名称、尺寸、压缩类型、作者、年代等方面标引图像,一般以关键词形式的提问查询图像的一种技术。
基于内容的图像检索技术:分析图片本身,提取特征值,然后和大量其他图片的特征值进行比较,搜出相同、相关或相似图片的一种技术。
以图搜图:基于内容的图片检索,利用机器学习、模式识别、计算机视觉等相关技术对图片的内容进行分析、检测、检索的一种应用。
图像特征的三个层次:原始特征层(图像的原始像素点)、物理特征层(图像的颜色、纹理、形状和轮廓等低层物理特征)、语义特征层(人们对图像内容概念级的反映)
颜色描述符:颜色直方图、颜色矩、颜色相关图、颜色相关向量
纹理描述符:小波变换、Gabor变换、共生矩阵、Tamura特征
形状描述符:傅里叶描述子、不变矩法
MPEG-7 Multimedia Content DescriptionInterface 多媒体内容描述接口,为多媒体信息提供一种标准化的描述,并将该描述与所描述的内容相关联,促进对各种多媒体信息 的快速查询和访问。
相似度匹配
常用距离公式:Euclidean Distance(欧几里德距离)、Intersection Distance(交叉距离)、Manhattan Distance(曼哈顿距离)、QuadraticDistance(二次型距离)
检索系统性能评价指标:查准率与查全率(召回率)(Precision and Recall)
查准率 = (检索出的相关信息量/检索出的信息总量)×100%
查全率 = (检索出的相关信息量/系统中的相关信息总量)×100%
3.图像检索基本框架
图1. 图像检索基本算法流程图
4.相关学习资源
1) 计算机视觉领域顶级会议和IEEE期刊
ü ICCV InternationalConference of Computer Vision
ü CVPR Computer Vision andPattern Recognition
ü ECCV European Conference onComputer Vision
ü MICCAI International Conference on Medical Image Computing andComputer Assisted Intervention
ü ICML International Conference on Machine Learning
ü TMI Transactions on Medical Imaging
ü TPAMI Transactions on Pattern Analysis and Machine Intelligence
ü IJCV International Journal of Computer Vision
ü NIPS Annual Conference on Neural Information Processing System
ü TBME Transactions on Biomedical Engineering
ü JBHI Journal of Biomedical and Health Informatics
ü TIP Transactions on Image Processing
ü PR Pattern Recognition
2) 以图搜图相关资料:http://blog.csdn.net/carson2005/article/details/11636673
3) 机器视觉开源处理库汇总:http://blog.csdn.net/carson2005/article/details/16821131
4) 视觉与学习青年学者研讨会网站:http://valseonline.org/portal.php
5) 图像处理与计算机视觉博客:
http://blog.csdn.net/liuyue2046/article/details/12658441
6) Matlab计算机视觉/图像处理工具箱推荐:
http://blog.csdn.net/liuyue2046/article/details/12658441
7) 计算机视觉论坛:http://www.cvchina.net/
8) Free Online Courses From TopUniversities:Coursera https://www.coursera.org/
当前存在的问题及对策:
文献调研质量尚未达到自己的预期
1. 提高文献检索的效率与质量(√);
2. 在文献调研过程中有针对性同步补充相关学科理论知识;
3. 同步增加实践、验证环节