2011年06月_ChenLee_1

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月

原创霍夫变换（Hough Transform）

霍夫变换是图像处理中的一个检测直线、圆等简单几何形状的方法。它最初是用于在二值化的图像中进行直线检测的。对于图像中的一条直线而言，利用直角坐标系，可以表示为：的形式。那么，该直线上任意一点（x,y）变换到k-b参数空间将变成一个“点”。也就是说，将图像空间中所有的非零像素转换到k-b参数空间，那么它们将聚焦在一个点上。如此一来，参数空间中的一个局部峰值点就很有可能对应着原图像空间中的一

2011-06-26 12:12:00 34226 6

原创 H.264

H.264是一种高性能的视频编解码技术，目前世界上制定视频编解码技术标准的组织有两个：国际电联组织（IUT-T），它制定的标准有H.261,H.262,H.263等。另一个是国际标准化组织（ISO），它制定的标准有MPEG-1，MPEG-2，MPEG-4等。而H.264则是这两个组织联合起来共同制定的一种视频编解码技术。而且它将成为MPEG-4标准的第10部分。因此，不论是MPEG-4 A

2011-06-19 11:12:00 2693 2

原创 MPEG标准

MPEG是Moving Picture Experts Group的简称，其本意指代一个研究音频和视频编码标准的小组，如今，它泛值由该小组指定的一系列视频编码标准。自1998年成立以来，该小组已经相继制订了MPEG-1，MPEG-2，MPEG-3，MPEG-4，MPEG-7等多个标准。MPEG组织，到目前为止，已经指定并正在指定以下视频标准：MPEG-1：第一个官方指定的音视频压缩标准，随

2011-06-19 10:33:00 3639

原创 JPEG格式

JPEG的全称是Joint Photographic Experts Group（联合图像专家小组），它是一种常用的图像存储格式，其文件后缀名一般为“.jpg”或".jpeg"。JPEG格式可以分为标准JPEG、渐进式JPEG和JPEG2000三种格式。标准JPEG:该类型的图片文件，在网络上应用较多，只有图片完全被加载和读取完毕之后，才能看到图片的全貌；它是一种很灵活的图片压缩方

2011-06-18 20:10:00 4377

原创 XVID的前世今生

XVID是一个开源的MPEG-4视频压缩解压算法库。它的发展壮大，还有一段触目惊心的过程。下面，我将为大家展开讲述其中的故事。1998年，微软开发了当时世界上唯一一个能在PC上使用的MPEG-4视频编解码器，它包括MS-MPEGV1，MS-MPEGV2，MS-MPEGV3共三个系列的编解码内核。其中的V1和V2用来制作AVI文件。相对来说，V3的画面质量要比V1和V2好很多。不过，微软却将这一

2011-06-18 19:04:00 5658 3

原创 OpenCV的SVM用法

在OpenCV当中，SVM是作为一个类来定义接口的，其定义略显复杂。不过，如果你对libSVM比较了解，就会发现，OpenCV的SVM接口与libSVM的接口非常接近。下面，我还利用前面介绍libSVM用法时的数据，通过一个简单的例子程序来介绍OpenCV的SVM模块函数的用法。// OpencvSVM.cpp : Defines the entry point for the conso

2011-06-15 22:31:00 30018 3

原创 libSVM应用举例

前面提到，很多人看到libSVM这么多的参数，估计要犯晕了。没关系，我之前把相关的libSVM参数已经讲解了一遍，这里，再给出libSVM的用法。如果你不想花时间去仔细研究libSVM，完全可以参照我的函数来直接调用libSVM完成你的工作。首先是训练SVM得到模型；假设，有10个训练样本，每个训练样本，有12个特征值，即：每个训练样本的维数是12，也就是说，训练

2011-06-12 11:50:00 16828 27

原创 libSVM介绍（二）

鉴于libSVM中的readme文件有点长，而且，都是采用英文书写，这里，我把其中重要的内容提炼出来，并给出相应的例子来说明其用法，大家可以直接参考我的代码来调用libSVM库。第一部分，利用libSVM自带的简易工具来演示SVM的两类分类过程。（以下内容只是利用libSVM自带的一个简易的工具供大家更好的理解SVM，如果你对SVM已经有了一定的了解，可以直接跳过这部分内容）首

2011-06-12 11:27:00 47017 24

原创数字图像处理的定义

数字图像处理方法的研究源于两个主要应用领域：（1）为了便于人们分析而对图像信息进行改进；（2）为了使机器具有类似于人类的分析和理解图像的能力而进行的各种分析和研究；一幅图像可以定义为一个二维函数f(x,y)，这里，x和y是空间坐标。在任何一个空间坐标（x,y）上的幅值f称为图像在该点的强度或者灰度。当x,y,f为有限的、离散的数值时，称其为图像。简单点说，数字图像是由有限的元素组成的，每一个元

2011-06-08 20:27:00 5665 1

一直在写计算机视觉方面的博客，估计有人都烦了，从来都没见有啥具体的应用。别着急，今天我还真找到一个，Prof.Gary Bradski(OpenCV开山鼻祖，opencv learning的作者)领导的Willow Garage机器人研究小组，一直在做家庭，生活方面应用的机器人。他们的主页是：http://www.willowgarage.com,目前他们的机器人，已经可以完成一些简单的动作。例如

2011-06-08 19:40:00 4360 2

原创开源SVM库libSVM介绍

libSVM是台湾大学林智仁教授等研究人员开发的一个用于支持向量机分类，回归分析及分布估计的c/c++开源库。另外，它也可以用于解决多类分类问题。 libSVM最新的版本是2011年4月发布的3.1版。林智仁教授设计开发该SVM库的目的是为了让其它非专业人士可以更加方便快捷的使用SVM这个统计学习工具。libSVM提供了一些简单易用的接口，从而使得用户可以方便的使用，而不必关心其内部复杂的

2011-06-05 17:19:00 14501 4

压缩感知的几个入门文章

这几篇是个人觉得比较通俗易懂的入门文章，（1）压缩感知研究；戴琼海、付长军；清华大学；计算机学报 2011 （2）压缩感知；许志强；中科院计算所； 2012；（3）压缩感知理论及其研究进展；石光明、刘丹华；西电；电子学报； 2009；（4）一个武汉大学的PPT，2011年的（5）压缩感知回顾与展望；焦李成、杨淑媛；西电；电子学报； 2011；

2013-10-12

Andrew Ng教授关于特征表述的PPT

斯坦福大学Andrew Ng教授的PPT，内容涉及机器学习，特征表述，稀疏，无监督学习等；

2013-10-02

斯坦福大学Andrew Ng教授的深度学习深度神经网路PPT

斯坦福大学Andrew Ng教授的一个PPT，内容主要涉及特征表述，深度神经网络，深度学习等；

2013-10-02

积分通道特征资料

一种新的行人检测特征描述方法--积分通道特征，里面有3个pdf文献，一个是原文，一个是附录，一个摘要；

2013-01-02

行人检测2012PAMI综述

20页的PDF,2012年发表在PAMI上的行人检测综述性文章；

2012-12-19

PAMI2012行人检测综述

2012年PAMI上发表的一篇关于行人检测的综述性文章，PDF格式，共20页，对常见的16种行人检测算法进行了简单描述，并在6个公开测试库上进行测试，给出了各种方法的优缺点及适用情况。另外，指出了未来行人检测的发展方向和趋势。

2012-12-18

TLD跟踪算法相关论文

TLD跟踪算法相关的论文及PPT；其中，PPT4个，PDF论文5篇；对于深入理解TLD算法有帮助；

2012-11-28

TLD算法论文及PPT

9个Pdf文件，其中，有4个是ppt，5个是论文，内容全部是关于TLD跟踪算法的；well,不了解TLD跟踪算法的可以参考我的博客：http://blog.csdn.net/carson2005/article/details/7647500