蝴蝶也可以飞过沧海
硕士在读科研方向计算机视觉与模式识别具体研究图像检索
展开
-
Bag-of-words model in computer vision
一、Bag-of-words model Bag-of-words model是用于自然语言处理和信息检索中的一种简单的文档表示方法。通过这一模型,一篇文档可以通过统计所有word的数目来表示,这种方法不考虑语法和word出现的先后顺序。这一模型在文档分类里广为应用,通过统计each word的frequency来作为分类器的特征。通过下面的例子来说明用这一model来表示文档的基本方法:原创 2013-07-13 11:52:11 · 2153 阅读 · 0 评论 -
计算机视觉的学习资源
1.ENS/INRIA Visual Recognition and Machine Learning Summer Schoolhttp://www.di.ens.fr/willow/events/cvml2013/2.Visual Recognition and Machine LearningSummer School, Paris, 22原创 2014-03-27 14:34:05 · 917 阅读 · 0 评论 -
一个很有用的图像处理工具箱
发现了一个很有用的图像处理工具箱!原创 2014-08-15 20:14:31 · 6366 阅读 · 10 评论 -
漫谈计算机视觉
从输入图象到信息获取之间存在着巨大的认知空白,其间需要经过一系列十分复杂的信息处理和理解过程。想象一下,在火车站,我们可以从茫茫人群中精确地找出要迎接的伙伴,这远非现在的机器学习、搜索引擎所能解决的。这再次证明人类视觉系统的强大。对人类视觉过程本质的认识,乃是揭开机器视觉进步的关键。对计算机而言,所有的输入均是矩阵,机器视觉的目的,就是要从这些矩阵中获取有用的信息。计算机对图像内容的识别,转载 2014-08-16 21:11:45 · 916 阅读 · 0 评论 -
图像处理中的L1-normalize 和L2-normalize
当一幅图像用某种特征表示出来,一般要进行L1-normalize或者是L2-normalize。假设一幅图像表示为Y=[x1 x2 x3 x4 x5],L1-normalize的结果为:L2-normalize的结果为:通过L1或L2标准化的图像特征往往具有良好的效果,至于那个更好就需要自己试验。假设我们提取一个图像库的特征为histograms,其中列原创 2014-03-21 18:46:52 · 26165 阅读 · 3 评论 -
RGB转化灰度图公式
方法一:对于彩色转灰度,有一个很著名的心理学公式: Gray = R*0.299 + G*0.587 + B*0.114方法二:而实际应用时,希望避免低速的浮点运算,所以需要整数算法。注意到系数都是3位精度的没有,我们可以将它们缩放1000倍来实现整数运算算法: Gr转载 2016-06-02 11:06:01 · 12516 阅读 · 0 评论 -
模板滤波实现(笔记)
#include "stdio.h"#include "opencv2/opencv.hpp"using namespace std;using namespace cv;/** pGrayImg:灰度图像数据 pFilterImg:滤波结果图像数据 pTemplate:模板数据 nImgH:图像高度 nImgW:图像宽度 nTempH:模板高度 nTempW:模板宽度原创 2016-09-19 17:19:06 · 2103 阅读 · 0 评论 -
将图像进行分块(笔记)
以下代码实现了将图像分成4*4块,然后进行操作:int main(){ char* imgPath = "..\\img2.jpg"; //[1] 获取图片数据,并转化成灰度图 Mat img = imread(imgPath); if (NULL == img.data) { printf("read img error!\n"); exit(1); } Mat原创 2017-01-22 11:01:46 · 8415 阅读 · 0 评论 -
利用SSE求取水平与垂直梯度图(笔记)
目的:利用sse求取图像的垂直和水平梯度图,加快求梯度图的运算速度代码实现:#include "stdio.h"#include "opencv2\\opencv.hpp"#include "sse.h"using namespace std;using namespace cv;int main(){ //[1] 读取图像,并把图像转化成灰度图 Mat img = i原创 2017-02-21 18:09:17 · 1306 阅读 · 2 评论 -
ISP算法:gamma矫正
Gamma矫正:在视频系统,线性光Intensity通过Gamma校正转换为非线性的视频信号,通常在摄像过程内完成。矫正原因:起初人们发现,CRT显示器使用电子显像管,控制电流大小显示屏幕上的亮度,电流和亮度之间存在非线性关系,其中gamma值是CRT显示器的伽马值:成像显示设备,输入能量和图片颜色是成线性的。这就导致显示器显示的图像和实际图像不一致,因此引入了gamma矫正:原创 2018-01-31 11:30:31 · 7591 阅读 · 1 评论 -
ISP算法:黑电平矫正
黑电平:图像数据为0时,对应的信号电平。黑电平矫正:由于暗电流的影响,导致没有光线照射,传感器传出的图像数据不为0。(暗电流:物理器件不可能是绝对理想的,由于杂质、受热等影响,即使没有光照射到像素,像素值也会产生电荷,这些电荷产生暗电流。)需要注意:除了暗电流的原因之外,需要矫正还有一个原因:CMOS传感器采集的信息经过一系列转换生成原始RAW格式数据。以8bit数据为例,单个pixel的原创 2018-02-01 11:28:21 · 4762 阅读 · 0 评论 -
ISP算法:镜头阴影矫正
镜头阴影矫正(Lens Shading Correction)是为了解决由于lens的光学特性,由于镜头对于光学折射不均匀导致的镜头周围出现阴影的情况。lens shading分为两种luma shading(亮度阴影)和color shading(色彩偏差)。luma shading:由于Lens的光学特性,Sensor影像区的边缘区域接收的光强比中心小,所造成的中心和四角亮度不一致原创 2018-02-01 13:49:20 · 7090 阅读 · 2 评论 -
ISP算法:宽动态HDR
动态范围(Dynamic Range):在很多领域来表示某个变量的最大值和最小值的比值。在数字图像处理领域里,动态范围也被称为图像对比度,表示图像可以显示范围内,像素最大亮度值和最小亮度值的比值。高动态范围图像(High Dynamic Range Image):可以反映真实场景中高动态范围亮度信息图像。高动态技术:能自动调整图像动态范围的一种技术。该技术是一种利用计算机高速运算产生高原创 2018-02-06 16:44:09 · 13936 阅读 · 1 评论 -
ISP算法:图像质量评价
图像质量有两个基本方面:<1> 观者感受;<2>满足客户需求的技术方法和设计。图像质量参数:锐度、噪声程度、色彩准确度等等。图像质量评价方法,分为两种:主观评价方法:设计实验,由观测者对样本集图像质量进行评价;客观评价方法:采用算法对图像质量做出评价。主观评价费时、费力,且标准难以量化;客观评价算法难以和主观感受一致。...原创 2018-02-12 11:59:33 · 1980 阅读 · 0 评论 -
ISP : 灯箱光源(笔记)
标准光源是指模拟各种环境光线下的人造光源,让生产工厂或实验室非现场也能获得与这些特定环境下的光源基本一致的照明效果。标准光源通常安装在标准光源箱内,主要用于检测物品的颜色偏差。人造的标准光源主要有如下10种类型:模拟蓝天日光——D65光源 色温:6500KD65--国际标准人工日光(Artificial Daylight) 色温:6500K 功率:18W模拟北方平均太阳光——D75光源 色温:75...原创 2018-02-28 10:56:13 · 1240 阅读 · 0 评论 -
机器学习讲座总结-读图时代的识图技术-车库咖啡
转自: http://blog.sina.com.cn/s/blog_eb3aea990101f3uo.html在车库咖啡见到了传说的中的大牛 黄畅博士 @黄畅_了解的不只是人脸 ,黄博士对于识图技术进行了一个综述,下面是这次报告的总结。1. 关于机器学习优化的目的:黄博士提到机器学习并非以求最优为目的,而是以控制overfitting为目的。这个非正式报告中提到的问题转载 2014-02-13 19:37:58 · 1267 阅读 · 0 评论 -
黑夜给了我黑色的眼睛,我却用它研究CV
编者按:计算机视觉(Computer Vision)领域历史悠久,业界对此一直都不缺乏想象。当图像和视频总量每年以数十倍的速度增长,增长到人们有一天再也无法通过文字整理和检索这些信息时,计算机视觉技术或许会和当年的关键字搜索技术一样,成为救世主。本文来自美国计算机视觉公司创始人Orbeus刘天强(微博@刘天强Orbeus)投稿,从“究竟什么是计算机视觉技术、它的局限性何在、它应用在实际场景转载 2014-02-06 14:52:16 · 1034 阅读 · 0 评论 -
计算机视觉、机器学习相关领域论文和源代码大集合
一、特征提取Feature Extraction:· SIFT [1] [Demo program][SIFT Library] [VLFeat]· PCA-SIFT [2] [Project]· Affine-SIFT [3] [Project]· SURF [4] [OpenSURF] [Mat转载 2013-06-27 16:23:51 · 1208 阅读 · 2 评论 -
计算机视觉与模式识别的参考网站集合
一、研究群体http://www-2.cs.cmu.edu/~cil/vision.html这是卡奈基梅隆大学的计算机视觉研究组的主页,上面提供很全的资料,从发表文章的下载到演示程序、测试图像、常用链接、相关软硬件,甚至还有一个搜索引擎。 http://www.cmis.csiro.au/IAP/zimage.htm这是一个侧重图像分析的站点,一般。但是提供一个Image An转载 2013-06-30 10:43:04 · 5131 阅读 · 0 评论 -
CV papers reading
一个很好的下载图像处理与模式识别相关文章的网址,里面还有一些datasets和代码等资源:http://www.cvpapers.com/index.html原创 2013-07-23 17:21:58 · 962 阅读 · 0 评论 -
计算机视觉会议时间表
Calendar of Computer Image Analysis, Computer Vision Conferenceshttp://iris.usc.edu/Information/Iris-Conferences.html转载 2013-08-20 19:32:21 · 1464 阅读 · 0 评论 -
关注图像检索(1)
图像搜索引擎即服务,VSearch想为购物搜索服务提供商提供图像搜索技术API#36氪开放日硅谷站#说到图片搜索在电商 / 购物市场的应用,很容易让人想起收购了 Snaptell 的 Amazon,还有从天使轮起就向淘淘搜投资的淘宝。对于巨头来说,他们有资金和实力来投资甚至收购一家做图片搜索技术的创业公司,并将其收归麾下。但如果要自行开发图像搜索引擎,对中小型电商或相关服务的提供商来说是一转载 2013-09-07 14:45:52 · 1037 阅读 · 0 评论 -
神奇的图像处理
一、像素图生成向量图的算法数字时代早期的图片,分辨率很低。尤其是一些电子游戏的图片,放大后就是一个个像素方块。Depixelizing算法可以让低分辨率的像素图转化为高质量的向量图。二、黑白图片的着色算法让老照片自动变成彩色的算法。三、消除阴影的算法不留痕迹地去掉照片上某件东西的阴影的算法。四、HDR照片的算法转载 2013-09-19 18:37:42 · 790 阅读 · 0 评论 -
计算机视觉和模式识别的code
UIUC的Jia-Bin Huang同学收集了很多计算机视觉方面的代码,链接如下:https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html TypeTopicNameReferenceLinkCode转载 2013-10-05 15:07:48 · 4038 阅读 · 1 评论 -
Lena与图像处理
在数字图像处理中,Lena(Lenna)是一张被广泛使用的标准图片,特别在图像压缩的算法研究中。(为什么用这幅图,是因为这图的各个频段的能量都很丰富:即有低频(光滑的皮肤),也有高频(帽子上的羽毛),很适合来验证各种算法) 然而,这张图片背后的故事是颇有意思的,很多人都抱有学究都是呆子的看法,然而Lena对此就是一个有力的驳斥。lena(lenna)是一张于19转载 2013-09-22 11:40:22 · 2399 阅读 · 0 评论 -
以图搜图的相关资料
基于内容的图片检索(Content Based Image Retrieval, CBIR),也有人称之为以图搜图,是一个很老的研究领域,它是利用机器学习、模式识别、计算机视觉等相关技术对图片的内容进行分析、检测、检索的一种应用。随着近年来模式识别与机器学习的快速发展,该领域又逐渐火热起来,并涌现出很多实际可用的商业系统。同时,越来越多的公司和机构开始涉足该领域,以此来推动以图搜图的快速发展与成长转载 2013-10-13 09:27:30 · 1725 阅读 · 0 评论 -
Hellinger distance
在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度。它是f散度的一种(f散度——度量两个概率分布相似度的指标)。Hellinger距离被定义成Hellinger积分的形式,这种形式由Ernst Hellinger在1909年引进。 目录·1 定义 ·1.1 度量理论 ·1.2 基于Lebesgue度量的概率理论 ·1转载 2013-10-21 16:53:25 · 10764 阅读 · 0 评论 -
21世纪初最有影响力的20篇计算机视觉期刊论文
选取论文的原则:(1)期刊论文,主要来源于以下期刊:TPAMI,IJCV,TIP,CVIU,IVC,MVA,PR,JMIV,IJPRAI…(2)发表在2000年以后(3)SCI检索次数大于1000,来源于Web of Science数据库,2012年12月初的检索结果Top 20 榜单如下:[1] D. G. Lowe, “Distinctive i转载 2013-11-04 13:31:12 · 1112 阅读 · 2 评论 -
如何从视频中提取每一帧图像
实验目的:从一部电影里提取出一秒里面多帧图像的一帧;实验实代码:clearclose all % 创建视频读取对象,并设置参数xyloObj = VideoReader('j.mp4'); nFrames = xyloObj.NumberOfFrames;vidHeight = xyloObj.Height;vidWidth = xyloObj.Width;原创 2013-11-20 17:25:28 · 33964 阅读 · 4 评论 -
相似度计算
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。 本文的目的就是对常用的相似性度量作一个总结。本文目录: 1. 欧氏距离 2. 曼哈顿距离 3. 切比雪夫距离转载 2013-11-13 21:32:25 · 1430 阅读 · 0 评论 -
Computer Vision的尴尬---by林达华
Computer Vision是AI的一个非常活跃的领域,每年大会小会不断,发表的文章数以千计(单是CVPR每年就录取300多,各种二流会议每年的文章更可谓不计其数),新模型新算法新应用层出不穷。可是,浮华背后,根基何在?对于Vision,虽无大成,但涉猎数年,也有管窥之见。Vision所探索的是一个非常复杂的世界,对于这样的世界如何建模,如何分析,却一直没有受普遍承认的理论体系。大部分的研究转载 2014-01-22 14:36:44 · 1029 阅读 · 0 评论 -
ISP算法:自动白平衡(AWB)
1. 为什么要做白平衡?人类视觉系统具有颜色恒常性特点,一次人类对物体观察不受光源影响。但是Sensor在不同光线下,物体呈现的颜色不同,在晴朗天空下会偏蓝,在烛光下会偏红。如图:2.什么是自动白平衡?为了消除光源对于图像传感器成像的影响,模拟人类视觉系统的颜色恒常性。保证在任何场景下看到的白色是真正的白色。3. 如何做自动白平衡?只要乘以一个对角矩阵,便可以进行白平衡...原创 2018-08-24 10:52:27 · 18811 阅读 · 2 评论