自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

delltdk的专栏

CV领域的探索内容、interest内容和参考内容

  • 博客(38)
  • 资源 (5)
  • 收藏
  • 关注

原创 基于OpenPose和Human segmentation的游戏人物解析(附源码)

基于OpenPose和Human segmentation的游戏人物解析(附源码)——基于PaddleHub的真人街霸游戏GithubAI studio街霸(Street Fighter)是大家非常熟悉的一个游戏。小时候我们都会和小伙伴们互相喊着“阿斗根”来发大招。现在借助于Paddlehub提供的视频人物分析技术,我们可以进入到街霸的世界里,虐别人和被虐。一、游戏展示b站链接:https://www.bilibili.com/video/BV1qi4y1P7db/

2021-03-23 21:36:41 785

转载 人脸关键点检测中的CLM/RL-Mean-shift/CLNF

最近一篇文章《Deformable Model Fitting by Regularized Landmark Mean-Shift》中的人脸点检测算法在速度和精度折中上达到了一个相对不错的水平,这篇技术报告就来阐述下这个算法的工作原理以及相关的铺垫算法。再说这篇文章之前,先说下传统的基于CLM(Constrained local model)人脸点检测算法的不足之处,ASM也属于CLM的一种,C

2015-11-12 16:23:33 10718

原创 shell脚本编写的flipbird

最近学习Linux脚本方面,以此程序锻炼一下,有很多地方写的不到位,还是很罗嗦。#!/bin/bashfunction random(){ min=$1 max=`expr $2 - $1` num=$RANDOM temp=$(( $num % $max )) retnum=$(( $temp + $min )) echo $retnum}function pr

2015-11-10 00:38:43 1608

原创 【A Neural Algorithm of Artistic Style】 Pics

图中是我市的标志

2015-10-13 13:18:31 1471

原创 Caffe 基本层参数简介

Caffe更新很快,以下内容可能与最新master有出入,不过如果参数名字没有更改应该没有变化。具体可以查看src/caffe/proto/caffe.proto文件内的定义。1. Data输入层  name / type / top / bottom 是所有layer都有的参数域,DATA层与众不同的是包含data_param和transform_param两个域,并且通常包含会有dat

2015-08-19 13:30:43 3718

转载 .o .so 文件

linux下文件的类型是不依赖于其后缀名的,但一般来讲:.o,是目标文件,相当于windows中的.obj文件.so 为共享库,是shared object,用于动态连接的,和dll差不多.a为静态库,是好多个.o合在一起,用于静态连接.la为libtool自动生成的一些共享库,vi编辑查看,主要记录了一些设置信息。能用如下命令查看*.la文件的格式   $file *.la

2014-11-26 16:20:08 909

转载 Linux中的ar命令

当我们的程序中有经常使用的模块,而且这种模块在其他程序中也会用到,这时按照软件重用的思想,我们应该将它们生成库,使得以后编程可以减少开发代码量。这里介绍命令ar,用来对库操作。 1.ar基本用法  ar命令可以用来创建、修改库,也可以从库中提出单个模块。库是一单独的文件,里面包含了按照特定的结构组织起来的其它的一些文件(称做此库文件的member)。原始文件的内容、模式、时间戳、属主、组等

2014-11-26 16:08:23 716

原创 基于韦尔莱算法的可撕扯的幕布

题记:写这个程序是因为偶然看到一个

2014-10-14 01:01:41 1741

翻译 【机器学习十大算法】C4.5

作者:Naren RamakrishnanContents1.1 简介

2014-08-20 17:34:05 6229

原创 <chrono> <TCLAP>与<CImg>

*******************************************************************chrono --------C++*******************************************************************#include using namespace std

2014-08-19 14:47:25 1285 1

转载 从CVPR 2014看计算机视觉领域的最新热点

转自:http://blog.sina.com.cn/s/blog_4caedc7a0102uyjj.html

2014-07-31 13:50:33 1297

原创 直线拟合、二次曲线拟合、折线拟合和KNN近邻(附代码)

一个工程中的应用,需要对一组数据做上面四种形式的nihe

2014-05-16 11:58:57 10878 4

转载 信息检索(IR)的评价指标介绍-准确率、召回率、F1、mAP、ROC、AUC

在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式:             召回率(Recall)      =

2014-05-09 18:57:29 1292

原创 libjpeg与turbo libjpeg的使用

LibJpeg作为常用开源库,已有很多相关介绍。

2014-05-07 20:56:11 9594 1

原创 【行人检测】之Joint Deep Learning联合深度学习(附源码)

新近研究ICCV2013的一篇文章,《Joint Deep L》

2014-04-30 14:47:50 14765 53

转载 OpenMP中的任务调度

转自: OpenMP中的任务调度        OpenMP中,任务调度主要用于并行的for循环中,当循环中每次迭代的计算量不相等时,如果简单地给各个线程分配相同次数的迭代的话,会造成各个线程计算负载不均衡,这会使得有些线程先执行完,有些后执行完,造成某些CPU核空闲,影响程序性能。例如以下代码:int i, j;int a[100][100] = {0};for ( i

2014-04-23 16:53:44 977

原创 OpenCV源码解析之CascadeClassifier多尺度检测

1.  概述CascadeClassifier为OpenCV中cv namespace下用来做目标检测的级联分类器的一个类。该类中封装的目标检测机制,简而言之是滑动窗口机制+级联分类器的方式。OpenCV的早期版本中仅支持haar特征的目标检测,分别在2.2和2.4.0(包含)之后开始支持LBP和HOG特征的目标检测。2.  支持的特征对于Haar、LBP和HOG,CascadeCla

2014-04-15 10:13:02 8176 1

原创 OpenCV源码解析之动态内存管理CvMemStorage与CvSeq

1.    CvMemStorage一个对象性不强的结构体,它的作用还是在和CvSeq、文件读取等配合中体现出的。1.1     CvMemStorage结构图               1.2CvMemStorage定义于core模块下的types_c.h:typedef struct CvMemS

2014-04-09 12:46:52 4532

原创 CV_IMIN、CV_IMAX宏以及是否只有一位为1的检验

可能初看标题没能明白,记录的是OpenCV中不需要跳转的min和max宏以及另外一个位运算的等式。他们有一些共性,所以放在一起。先来看看CV_IMIN和CV_IMAX宏,定义如下(仅以CV_IMIN为例)以下部分转自http://www.cnblogs.com/speedmancs/archive/2011/05/07/2039535.html***************

2014-02-20 14:17:28 1485

转载 C++ typedef使用总结

转自:http://www.cnblogs.com/charley_yang/archive/2010/12/15/1907384.html 非原创第一、四个用途用途一:定义一种类型的别名,而不只是简单的宏替换。可以用作同时声明指针型的多个对象。比如:char* pa, pb; // 这多数不符合我们的意图,它只声明了一个指向字符变量的指针, // 和一个字符变量;

2014-02-20 10:25:46 788

转载 计算机视觉&模式识别Survey

************************************************************************************************************************************************************************************           在这里,我

2013-10-25 20:12:52 3056

转载 行人检测(Pedestrian Detection)资源

一、论文综述类的文章[1]P.Dollar, C. Wojek,B. Schiele, et al. Pedestrian detection: an evaluation of the state of the art [J].IEEE Transactions on PatternAnalysis andMachine Intelligence, 2012, 34(4): 74

2013-10-18 22:17:42 1508

转载 图文详解YUV420数据格式

转载自: http://www.cnblogs.com/azraelly/archive/2013/01/01/2841269.htmlYUV格式有两大类:planar和packed。对于planar的YUV格式,先连续存储所有像素点的Y,紧接着存储所有像素点的U,随后是所有像素点的V。对于packed的YUV格式,每个像素点的Y,U,V是连续交*存储的。 YU

2013-09-25 11:21:34 867

转载 极限优化:Haar特征的另一种的快速计算方法—boxfilter

这种以Boxfilter替代integral image 的方法很难使用到haar、LBP等特征检测中,因为像下面说的,它不支持多尺度,也就是说所提取的特征必须是同一个大小,最起码同一个宽高比的,这一点对宽高不定的haar特征、LBP特征都有很大的限制,但对于HOG特征因为尺度不像另外两个那样灵活,还是有迹可循的。采长补短申明:以下非笔者原创,原文转载自:http://www.

2013-08-19 09:14:08 1530

原创 分类器是如何做检测的?——【续】检测中的LBP和HAAR特征计算过程

前面介绍分类器检测过程的示例中是以HOG特征为例,那LBP和HAAR特征在xml中是如何表达和测试的呢?2.3    LBP与HAAR特征HAAR特征的计算和表达方式与HOG很类似,在OpenCV的haartraining.exe中,feature保存在每个weakclassifier中,而之后的traincascade.exe中则是以LBP、HOG、HAAR三种统一的方式——在stage

2013-08-15 15:58:45 5957 5

转载 IplImage 与 CBitmap类 的相互转换

在VC中利用OpenCV做图像处理程序时,有时需要把IpImage 类型和CBitmap类型相互转换,这样就可以利用VC中的GDI+函数对图像进行某些特殊的显示和处理,非常方便。这里是本人项目中写的两个转换小函数,仅供参考,转载注明,这样方便发现问题的朋友联系我及时修改。IplImage转换为CBitmap类型CBitmap *IplImage2CBitmap(const IplI

2013-07-28 01:13:23 1685

转载 兼容CDC保存整个屏幕程序以及从此引申的思考

转自:http://hi.baidu.com/lysygyy/item/fc26b9121acb62cd38cb3003今天在QQ上和一个CSDN的专家闲聊,因为他是一所大学的老师,所以,我们还是蛮谈的来的,突然他发来一段代码,让我解释一下原理,我这个郁闷,是不是这位老兄又在故意刁难我(因为之前被他刁难过好几次),万一某一句说的不好,让他抓住把柄把我嘲笑一番就丢人死了,哎,硬着

2013-07-27 17:14:51 1136

原创 为什么负数的反码在取反后还要加一?

Quote:一个以反码表示的整数,如果是正数那么只要直接转换成二进制就可以,而负数的反码需要取反加一,这是为什么呢?计算机中只有加法,没有加法,那么如果要计算5-1这样的运算该怎样来操作呢?或许这就是反码由来吧。通过反码所有整数的运算都只需要加法就可以完成了,也就是说把减法转换成了加法。再者计算机中一个的表示是n位bit,因而它是有上限的。比如8bit最大的数就只能是255了。所以

2013-07-01 21:21:58 12958

原创 分类器是如何做检测的?——CascadeClassifier中的detectMultiScale函数解读

转载注明出处即可。在进入detectMultiScal函数之前,首先需要对CascadeClassifier做初始化。1.     初始化——read函数CascadeClassifier的初始化很简单:cv::CascadeClassifier classifier;classifier.load(“cascade.xml”); //这里的xml是训练得到的分类器xml

2013-06-27 13:50:27 67445 21

转载 推荐:《DNN与微软同声传译系统背后的故事》

这篇介绍DNN/语音识别的文章,其中有不少细节可以玩味,可以细细读一读。1. 宋謌平解释说,虽然两个术语都包含“深”字,但含义不尽相同,DNN中的“深”指确实存在多层结构的神经网络,它的含义务实;而Deep Learning中的“深”更像一个形容词,与“浅”相对,多少有些抽象或哲学意味。2. 当你认为已经解决一个难题时,总可以让这 个问题变得更困难。或早或晚,你总会发现现有

2013-06-17 13:40:08 1428 1

原创 Vector容器使用总结

vector作为动态扩展数组,使用相对方便。并且在增加或者删除一个元素时,内建机制能够保证它所划分的地址是连续的。下面是vector的几个常用函数,以及几个需要注意的问题。使用vector容器之前需要include 。1. capacity()    返回当前vector的容量,也就是分配的空间大小,最多能容纳的元素数量;2. size()    返回当前vector的体积,也

2013-05-21 13:06:45 1247

原创 Lecun 手写数字数据

最近几天在搞CNN,大家经常用到的是Lecun公布的Handwriten digits数据,在他公布的网页上,数据不是那么方便,所以把这些数据转换了下,全部保存成jpg图片格式了,和大家分享一下。这两天任务较多,虽然继续在翻译和学习的工作,但是没有更新博客内容,过两天把心得体会做个总结,继续搞起。下载地址:http://download.csdn.net/detail/delltd

2013-05-20 21:46:55 1303

原创 神经网络学习的原理与在OpenCV中的应用

1. 神经网络介绍    神经网络的原理根本在于对人类大脑行为的神经生物学模拟,这样看的话克隆技术也能算一种了吧。大脑可以看做一台精密、稳定、计算能力超强的计算机,其中的信息处理单元就是神经元(Neuron)。神经元是大脑处理信息的最小单元,它的结构如下图(再次使用了这个图):Figure 1. 神经元结构    这个图抽象一下,由三部分组成:细胞体(Cell Body)、树突

2013-05-12 12:16:00 4021 2

原创 对Adaboost和SVM的一点直观认识

接触机器学习最早就是这两个分类器开始的,今天想起了这两个概念,就脑海里滚动公式。想着它们做分类时的样子,想起写点对他们的直观认识,可能有很多不严谨的地方,看客可不要太较真啦。    说起Adaboost,想像一个包含所有数据点的集合,比如这些点就是每天在地铁站看到的所有女生,这个点里存储了女生x的身高、体重、皮肤颜色、发质、B、W之类不拉不拉不拉的一堆数据。现在问题就来了:什么样的算是美女啊?

2013-05-09 21:34:27 1431

原创 为什么是神经网络?

很多人都已经知道:深度学习成为2013年的热词。像Google、微软或者Stanford这样的机构还是有机会得窥一斑,ordinary guys少有接触应用级的DL技术,只是概念上的理解而已。    就我而言理解到的只有两个fold里的三个点:结构上的CNN和一个好深的网络;功能上人工特征环节的得到strutured。其实我把CNN和structured的人工特征环节也是等同的,所以领

2013-05-09 01:28:38 945

翻译 【Introduction】人类大脑

人体大脑可以被视为一个三阶系统,如图1块状图所示(Arbib,1987)。处于系统核心的是大脑,图中以神经网表征,它不断接收信息、感知并做出恰当的判断。图中有两组箭头。由左指向右的表示信息承载信号在系统中的前向传输。由右指向左的(显示为红色)表示系统中的反馈。感知器官把来自人体或外界环境的刺激转化成电脉冲从而将信息传递到神经网(大脑)。效应器官把神经网产生的电脉冲转化成可识别的响应作为系统输出。

2013-05-09 00:39:41 1405

翻译 【Introduction】什么是神经网络?

人工神经网络,通常称为神经网络,其相关工作是由一个认识引起的:人类大脑以一种完全有别于传统数字计算机的方式进行计算。它是一个高度复杂、非线性、平行计算机(或者信息处理系统),具备自组织结构成分——也就是神经元——的能力,这样它能够以数倍于现存最快计算机的速度完成某种计算(比如模式识别、知觉、电动机控制)。例如可以试想人类的视觉,可以被看做一项信息处理任务。视觉系统的功能就是提供给我们所处周边环境的

2013-05-07 23:18:36 1661

原创 《神经网络与机器学习》开工篇

近期阅读学习《神经网络与机器学习》 (Simon Haykin, 2009),一直在想如何把所思所想以及书中内容记录下来做个总结也好,分享也好,交流也好,不要随着时间褪去全都还给时间。朋友推荐开个博客吧,我本来想买个小白板,这样有什么想法就可以立即呈现出来了。这两个都互不干扰,就一起搞吧。    作为ANN的第一篇,今后每天或者每周更新《神经网络》这本书的阅读、翻译、心得总结,给自己个supe

2013-05-06 13:08:07 1047 1

基于韦尔莱算法的可撕扯幕布模拟2

模拟一个可撕扯的幕布,基于韦尔莱算法实现,C++

2015-05-12

基于韦尔莱算法的可撕扯幕布模拟

模拟一个可撕扯的幕布,基于韦尔莱算法实现,C++

2014-10-14

添加对内存中Jpeg图像编解码接口的LibJpeg

很多都有对内存中Jpeg图像的解码接口,但是很少有人添加编码接口,所以写了一个。这里的编码接口jpeg_stdio_dest覆盖了原来的对文件的接口,并且添加jpeg_stdio_buffer_src(对内存解码)。 不过还是推荐使用turbo libJpeg,使用SIMD指令集以后,加速很多,并且提供了文件和内存两种编解码接口,就不存在上面提到的问题了。 文件中的“头文件与静态库.rar”可以直接拿来使用,如果要自己编译,就要用“LibJpeg.rar”了

2014-05-07

批量转换JPEG工具

试了下,可以把BMP和PNG图像批量转换成JPEG图像,其他格式没有做测试,感兴趣的朋友可以试试。另:请先阅读使用说明。

2013-06-05

Lecun HandWriten digit images

《Gradient-based Learning Applied to Document Recognition》,Lecun et al,1998论文中使用的手写数字数据,训练数据59998个,测试数据大约10k个。需要注意的是测试数据中有一部分是存在于训练数据中的。

2013-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除