Computer Vision
文章平均质量分 64
greenapple_shan
这个作者很懒,什么都没留下…
展开
-
HoG 和PHoG (pyramid HoG)
1)关于HoG的介绍可以参考博文:http://blog.csdn.net/kezunhai/article/details/88308602)而关于PHoG则可以参考:http://www.robots.ox.ac.uk/~vgg/research/caltech/phog.html3)PHoG源码下载(Matlab):http://www.robots.ox.ac.uk/~vg转载 2017-02-09 16:30:10 · 1788 阅读 · 0 评论 -
Beyond bags of features: Spatial Pyramid Matching 文章的笔记
研一一年,都在做图像分类的实验,之前一直苦于无法重复出论文中的结果,今天和博士讨论,发现对SPM这篇文章有一个地方理解有偏差,现在重新整理下思路,把自己对文章的理解写出来,以后再看时也能快速捡起来。SPM是对BoW模型的一个扩展,其核心是解决:两个集合的比较问题,这两个集合中所含特征个数不同,且特征之间是无序。盗用下图说明,对于X,Y图片来说,其中m和n通常不等,另X,Y中的各个点都是D维空间中的转载 2016-03-21 11:17:31 · 954 阅读 · 1 评论 -
目标检测的图像特征提取之(二)LBP特征
目标检测的图像特征提取之(二)LBP特征zouxy09@qq.comhttp://blog.csdn.net/zouxy09 LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子;它具有旋转不变性和灰度不变性等显著的优点。它是首先由T. Ojala, M.Pietikäinen, 和D. Har转载 2016-03-07 20:32:42 · 833 阅读 · 0 评论 -
目标检测的图像特征提取之(一)HOG特征
目标检测的图像特征提取之(一)HOG特征zouxy09@qq.comhttp://blog.csdn.net/zouxy09 1、HOG特征: 方向梯度直方图(Histogram of Oriented Gradient, HOG)特征是一种在计算机视觉和图像处理中用来进行物体检测的特征描述子。它通过计算和统计图像局部区域的梯度方向直方图来构转载 2016-03-07 16:53:51 · 572 阅读 · 0 评论 -
图像卷积与滤波的一些知识点
图像卷积与滤波的一些知识点zouxy09@qq.comhttp://blog.csdn.net/zouxy09 之前在学习CNN的时候,有对卷积进行一些学习和整理,后来就烂尾了,现在稍微整理下,先放上来,以提醒和交流。一、线性滤波与卷积的基本概念 线性滤波可以说是图像处理最基本的方法,它可以允许我们对图像进行处理,产生很多不同的转载 2016-03-30 11:53:06 · 495 阅读 · 0 评论 -
Going deeper with convolutions-GoogLeNet(阅读)
Abstract网络结构称为Inception,名字的获得来自Network in Network。这个网络是一个分类和检测的网络。该网络最大的特点就是提升了计算资源的利用率。在网络需要的计算不变的前提下,通过工艺改进来提升网络的宽度和深度。最后基于Hebbian Principle和多尺寸处理的直觉来提高性能。GoogLeNet有22层。IntroductionGoogL转载 2016-03-04 10:43:07 · 661 阅读 · 1 评论 -
CNN中感受野的计算
感受野(receptive field)是怎样一个东西呢,从CNN可视化的角度来讲,就是输出featuremap某个节点的响应对应的输入图像的区域就是感受野。比如我们第一层是一个3*3的卷积核,那么我们经过这个卷积核得到的featuremap中的每个节点都源自这个3*3的卷积核与原图像中3*3的区域做卷积,那么我们就称这个featuremap的节点感受野大小为3*3如果再经过poo转载 2016-03-02 20:25:17 · 2914 阅读 · 5 评论 -
光流法简单介绍
光流的概念是Gibson在1950年首先提出来的。它是空间运动物体在观察成像平面上的像素运动的瞬时速度,是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。一般而言,光流是由于场景中前景目标本身的移动、相机的运动,或者两者的共同运动所产生的。其计算方法可以分为三类:(1)基于区域或者基于特征的匹配方转载 2015-12-07 11:13:07 · 801 阅读 · 0 评论 -
经典算法之SRC分类器
自从05、06年开始,稀疏表示开始成为研究的热点。自从陶哲轩和他的小伙伴们解决了稀疏表示的理论问题,压缩感知或Sparse Representation成为学术界的研究热点。2008年,有Wright在PAMI上发表了一篇Sparse Representation based Classifier(SRC)的文章《Robust Face Recognition via Sparse Represe转载 2016-01-20 11:30:34 · 8945 阅读 · 1 评论 -
【论文笔记】Unsupervised Discovery of Mid-Level Discriminative Patches
阅读论文:Singh, S., Gupta, A., & Efros, A. A. (2012). Unsupervised Discovery of Mid-Level Discriminative Patches. ECCV.相关链接:http://graphics.cs.cmu.edu/projects/discriminativePatches/最近试图从中转载 2016-01-03 16:47:04 · 677 阅读 · 0 评论 -
视频里人流跟踪统计 Counting People by Tracking in Video
Computer Vision 是越来越火,最近全凭兴趣做了一个视频跟踪的Demo。原创 2015-11-29 17:28:56 · 5878 阅读 · 12 评论 -
Bag of Features (BOF)图像检索算法
1.首先,我们用surf算法生成图像库中每幅图的特征点及描述符。2.再用k-means算法对图像库中的特征点进行训练,生成类心。3.生成每幅图像的BOF,具体方法为:判断图像的每个特征点与哪个类心最近,最近则放入该类心,最后将生成一列频数表,即初步的无权BOF。4.通过tf-idf对频数表加上权重,生成最终的bof。(因为每个类心对图像的影响不同。比如超市里条形码中的第一位转载 2016-03-22 17:20:08 · 561 阅读 · 0 评论 -
tensorflow例程学习
问题记录1. https://github.com/tensorflow/models/issues/324原创 2016-09-16 21:51:59 · 882 阅读 · 0 评论 -
方向梯度直方图(HOG,Histogram of Gradient)学习笔记二 HOG正篇
1.介绍HOG(Histogram of Oriented Gradient)是2005年CVPR会议上,法国国家计算机科学及自动控制研究所的Dalal等人提出的一种解决人体目标检测的图像描述子,该方法使用梯度方向直方图(Histogram of Oriented Gradients,简称HOG)特征来表达人体,提取人体的外形信息和运动信息,形成丰富的特征集。2.生成过转载 2016-05-13 16:54:57 · 895 阅读 · 0 评论 -
根据两点经纬度计算距离
根据两点经纬度计算距离这些经纬线是怎样定出来的呢?地球是在不停地绕地轴旋转(地轴是一根通过地球南北两极和地球中心的假想线),在地球中腰画一个与地轴垂直的大圆圈,使圈上的每一点都和南北两极的距离相等,这个圆圈就叫作“赤道”。在赤道的南北两边,画出许多和赤道平行的圆圈,就是“纬圈”;构成这些圆圈的线段,叫做纬线。我们把赤道定为纬度零度,向南向北各为90度,在赤道以南的叫南纬,在赤道以北的转载 2016-04-26 15:55:04 · 4414 阅读 · 0 评论 -
深度学习(二十六)Network In Network学习笔记-ICLR 2014
深度学习(二十六)Network In Network学习笔记-ICLR 20142016-01-04 20:23 513人阅读 评论(0) 收藏 举报 分类: 深度学习(36) 版权声明:本文为博主原创文章,欢迎转载,转载请注明原文地址、作者信息。Network In Network学习笔记原文地址:http://blog.转载 2016-04-06 14:57:38 · 794 阅读 · 0 评论 -
Caffe + Ubuntu 15.04 + CUDA 7.5 新手安装配置指南
Caffe + Ubuntu 15.04 + CUDA 7.5 新手安装配置指南返回特别说明:0. Caffe 官网地址:http://caffe.berkeleyvision.org/1. 本文为作者亲自实验完成,但仅限用于学术交流使用,使用本指南造成的任何不良后果由使用者自行承担,与本文作者无关,谢谢!为保证及时更新,转载请标明出处,谢谢!2. 本文旨在转载 2016-03-23 16:38:05 · 770 阅读 · 0 评论 -
理解sparse coding
稀疏编码系列:(一)----Spatial Pyramid 小结(二)----图像的稀疏表示——ScSPM和LLC的总结(三)----理解sparse coding(四)----稀疏模型与结构性稀疏模型---------------------------------------------------------------------------转载 2016-03-22 22:02:54 · 454 阅读 · 0 评论 -
图像的稀疏表示——ScSPM和LLC的总结
稀疏编码系列:(一)----Spatial Pyramid 小结(二)----图像的稀疏表示——ScSPM和LLC的总结(三)----理解sparse coding(四)----稀疏模型与结构性稀疏模型--------------------------------------------------------------------------- 前言转载 2016-03-22 19:39:27 · 689 阅读 · 0 评论 -
总结SPM,ScSPM,LLC
博客开了很久,一直没有写东西。刚好前两天在实验室做了一个关于图像分类的报告,所以拿过来试试水。但CSDN的编辑器用起来不是很顺手,所以为了方便,博客中用了很多图片。引言关于图像的工作门槛一直比较高,因为图像中的信息太丰富,展现形式也很多,噪声也丰富,所以很难提取有效的特征,这就导致后面的分类任务变得非常麻烦。正如下图所示:正如于凯所说,特征定义了整个分类问题性能的上转载 2016-03-22 19:18:56 · 1255 阅读 · 0 评论 -
图像的稀疏表示——ScSPM和LLC的总结
稀疏编码系列:(一)----Spatial Pyramid 小结(二)----图像的稀疏表示——ScSPM和LLC的总结(三)----理解sparse coding(四)----稀疏模型与结构性稀疏模型--------------------------------------------------------------------------- 前言转载 2016-03-22 18:50:12 · 1025 阅读 · 0 评论 -
在VS2010中应用SIFT(C)源码
SIFT的实现有很多版本,具体方式都是那么几个,找个好用的不太容易,因为对于代码不熟练者各种版本用起来都有点水土不服,需要调整调整才行。本人是在VS2010下使用的Rob Hess的源码。一、前提安装Opencv,详见:VS2010+Opencv-2.4.0的配置攻略(该版本SIFT是基于Opencv的)。下载SIFT源码,见Rob Hess的主页(别告诉我不懂英文不知道下载链转载 2015-11-17 19:50:43 · 652 阅读 · 0 评论 -
CVPR 2015 Paper
本贴:http://blog.csdn.net/xuyuhua1985/article/details/46662283From: http://www.pamitc.org/cvpr15/program.php?from=timeline&isappinstalled=0Monday, June 88:30am-8:40a转载 2015-08-05 13:03:13 · 2578 阅读 · 0 评论 -
【OpenCV】访问图像中每个像素的值
转载请注明出处:http://blog.csdn.net/xiaowei_cqu/article/details/7557063!!此篇是基于IplImage* (C接口或者说2.1之前版本的接口,新的Mat的访问方式请参考博文:《访问Mat图像中每个像素的值》)IplImage是OpenCV中CxCore部分基础的数据结构,用来表示图像,其中Ipl是Intel转载 2015-06-15 18:32:48 · 560 阅读 · 0 评论 -
Histogram intersection(直方图交叉核,Pyramid Match Kernel)
看关于LBP人脸识别的论文时提到了Histogram intersection这个方法,方法最初来自The Pyramid Match Kernel:Discriminative Classification with Sets of Image Features这篇论文,用来对特征构成的直方图进行相似度匹配,下面介绍下原理。假设图像或其他数据的特征可以构成直方图,根据直方图间距的不同可以转载 2014-12-17 11:37:48 · 876 阅读 · 0 评论 -
The Pyramid Match Kernel学习[1]
翻译原文:概述: 基于内核的学习方法建立在将数据“嵌入”欧几里得空间,然后在嵌入的数据之间继续寻找线性关系的基础上。就SVM来说,它在嵌入的空间(也叫做特征空间)中找到了两个类之间的最佳的分割超面。形如"X × X → R"的内核函数K将成对的点映射到它们在嵌入的空间F中的内积(~内积是点乘吧~),从而能够评价所有点之间的相似性并确它们的相对位置(~??~内积越小越接转载 2014-12-17 13:53:54 · 854 阅读 · 0 评论 -
low level descriptors and high level descriptors
Types of visual descriptors[edit]Descriptors are the first step to find out the connection between pixels contained in a digital image and what humans recall after having observed an image or a原创 2014-11-25 15:36:09 · 1321 阅读 · 0 评论 -
ECCV 2014 Oral Paper
今年的ECCV 的paper已经挂到了网上,本文整了其中Oral Paper。 一,Tracking and Activity Recognition原创 2014-11-18 20:51:17 · 1402 阅读 · 0 评论 -
关于视频YUV
这里有一篇摘自MSDN的文章,介绍了YUV视频数据格式。About YUV VideoDigital video is often encoded in a YUV format. This article explains the general concepts of YUV video, along with some terminology, without g原创 2014-10-11 17:56:16 · 1336 阅读 · 0 评论 -
Hough Transform
霍夫变换是图像处理中的一个检测直线、圆等简单几何形状的方法。它最初是用于在二值化的图像中进行直线检测的。对于图像中的一条直线而言,利用直角坐标系,可以表示为:的形式。那么,该直线上任意一点(x,y)变换到k-b参数空间将变成一个“点”。也就是说,将图像空间中所有的非零像素转换到k-b参数空间,那么它们将聚焦在一个点上。如此一来,参数空间中的一个局部峰值点就很有可能对应着原图像空间中的一条直线。不过转载 2014-10-07 10:28:58 · 777 阅读 · 0 评论 -
CV牛人牛事
转载:http://emuch.net/html/201302/转载 2014-10-21 18:57:27 · 673 阅读 · 0 评论 -
手把手教你在Windows下使用MinGW编译libav
手把手教你在Windows下使用MinGW编译libav libav是在Linux下使用纯c语言开发的,不可避免的,libav源码使用了一些gcc的特性,那么在Windows下很难使用VC编译,但是使用MinGW编译却简单多了,下面我将根据自己的经历逐步介绍使用MinGW编译libav的过程以及在此过程中遇到的问题及其解决方法。1 安装MinGW编译环境1.1转载 2014-07-20 16:13:27 · 1301 阅读 · 0 评论 -
颜色直方图特征提取
#include #include #include #include using namespace std;int main( int argc, char** argv ){ IplImage * src= cvLoadImage("testImgSet\\caimei.jpg"); IplImage* hsv = cvCreateImage( cvGetSize(src原创 2013-04-19 22:16:01 · 3907 阅读 · 0 评论 -
Single Image Haze Removal(图像去雾)-CVPR’09 Best Paper
真正了解了什么叫最简单的就是最美好的真正的好文章不需要大堆公式堆积显得充实,而是最最平实的思想!这篇文章的:原文PDF、PPT。感兴趣的可以了解一下。这篇文章的目的就是以最简单的思路将图像达到去雾效果。用Matlab编了一下,效果图特别好啊哈:下面是摘录的:CVPR的中文名是计算机视觉与模式识别会议,是计算机视转载 2015-01-06 16:08:59 · 811 阅读 · 1 评论 -
Bag of Features (BOF)图像检索算法
1.首先,我们用surf算法生成图像库中每幅图的特征点及描述符。2.再用k-means算法对图像库中的特征点进行训练,生成类心。3.生成每幅图像的BOF,具体方法为:判断图像的每个特征点与哪个类心最近,最近则放入该类心,最后将生成一列频数表,即初步的无权BOF。4.通过tf-idf对频数表加上权重,生成最终的bof。(因为每个类心对图像的影响不同。比如超市里条形码中的第一位转载 2015-01-11 16:53:08 · 1101 阅读 · 0 评论 -
Fast Corner Detection
Fast Corner Detection在机器视觉里面,角点检测有好几种;其中,属Fast Corner Detection 比较好用。下面,介绍Fast Corner Detection源码。读者可以下载自己所需要的版本。下面以Opencv 版本为例。 由于Opencv版本的问题,会遇到如错误。fatal error C1083: 无法打开包括文件:“cxtypes.h”: No such f原创 2015-05-02 12:34:15 · 1512 阅读 · 0 评论 -
VS2008无法打开gl/glaux.h头文件的解决方法
不知道为什么到VS2008后,SDK中没有OpenGL的头文件了,下面针对这个问题总结一下。 在学习NeHe的纹理映射的Lesson 6中,开始需要用到包含gl/glaux.h的头文件,但是发现在我的系统中并没有这个头文件。并发现编译器中引用OpenGL的头文件路径有两个:C:/Program Files/Microsoft SDKs/Windows/v6.0A/include转载 2015-04-05 18:24:39 · 1107 阅读 · 0 评论 -
matlab练习程序(二值图像连通区域标记法,一步法)
这个只需要遍历一次图像就能够完全标记了。我主要参考了WIKI和这位兄弟的博客,这两个把原理基本上该介绍的都介绍过了,我也不多说什么了。一步法代码相比两步法真是清晰又好看,似乎真的比两步法要好很多。 代码如下:clear all;close all;clc;img=imread('liantong.bmp');imgn=img>128;s=uint8(1-imgn)转载 2015-03-18 16:07:12 · 2001 阅读 · 0 评论 -
【OpenCV】数字图像灰度直方图
灰度直方图是数字图像中最简单且有用的工具,这一篇主要总结OpenCV中直方图CvHistogram的结构和应用。灰度直方图的定义灰度直方图是灰度级的函数,描述图像中该灰度级的像素个数(或该灰度级像素出现的频率):其横坐标是灰度级,纵坐标表示图像中该灰度级出现的个数(频率)。一维直方图的结构表示为高维直方图可以理解为图像在每个维度上灰度级分布的直方图。转载 2015-03-12 19:55:33 · 792 阅读 · 0 评论 -
matlab练习程序(二值图像连通区域标记法,两步法)
我几乎完全就是照着WIKI百科上的算法实现的,不过是用Matlab而已。使用了两步法进行标记,一步法我还没怎么看。两步法中第二步是比较麻烦的,其中用到了不相交集合的一些理论,尤其是不相交集合森林,我这里的find_set函数就是参考《算法导论》311页的算法写的。如果用c++写,也许需要自己构造数据结构。 好吧,下面是我理解的算法过程: 1.首先要确定是标记8邻域连通还是4邻域转载 2015-03-11 21:24:21 · 5823 阅读 · 3 评论