2017年07月_xiaopihaierletian

原创行人检测实现和相关资料

最近一直在看行人检测的论文，对目前的行人检测做大概的介绍。行人检测具有极其广泛的应用：智能辅助驾驶，智能监控，行人分析以及智能机器人等领域。从2005年以来行人检测进入了一个快速的发展阶段，但是也存在很多问题还有待解决，个人觉得主要还是在性能和速度方面还不能达到一个权衡。1.行人检测的现状（大概可以分为两类）（1）.基于背景建模：利用背景建模方法，提取出前景运动的目标，在目

2017-07-29 21:36:51 952

转载如何加强神经网络训练

笔者最近在做行人重识别问题，故下面以提升reID的准确率为例：1. 扩大数据集调研CUHK01/CUHK03，要小心各个数据集中的bias（比如只有两个摄像头下的照片）同时，为了做比较，所以先只在market1501上测试。2.做数据增强（旋转，翻转，平移）采用了先resize到256，再crop一个227*227的策略。以50%的概率做镜像。3.triplet

2017-07-29 21:10:06 397

最近，在网上搜索关于“行人重识别”及“行人再识别”等关键词，发现几乎都是关于行人检测的内容。对于“行人重（再）识别”技术能找到的资料很少，这可能是因为“行人重（再）识别”技术最近才刚刚兴起吧。总之，除了能在谷歌学术中搜到一些Person re-identification的学术论文外，其他的资料明显没有行人检测的多。由于本人主要是学习“行人重（再）识别”技术的，每次和别人提起自己的研究方向时都要费

2017-07-29 21:08:48 3040 1

原创阅读A Discriminative Feature Learning Approach for Deep Face Recognition

论文链接：http://101.96.10.64/ydwen.github.io/papers/WenECCV16.pdf原作者代码链接Caffe：https://github.com/kpzhang93/caffe-faceMxNet：https://github.com/pangyupo/mxnet_center_lossWhat：对于分类任务来说，最后预测的是一个

2017-07-29 21:05:30 655

转载图像检索系列一：Deep Learning of Binary Hash Codes for Fast Image Retrieval

Deep Learning of Binary Hash Codes for Fast Image Retrieval 这篇文章发表在2015CVPR workshop文章链接：http://www.cv-foundation.org/openaccess/content_cvpr_workshops_2015/W03/papers/Lin_Deep_Learning_of_2015_CVPR

2017-07-29 21:04:03 927

翻译 Generative Adversarial Nets（译）

仅供参考，如有翻译不到位的地方敬请指出。论文地址：Generative Adversarial Nets摘要我们提出了一个通过对抗过程估计生成模型的新框架，在新框架中我们同时训练两个模型：一个用来捕获数据分布的生成模型G，和一个用来估计样本来自训练数据而不是G的概率的判别模型D，G的训练过程是最大化D产生错误的概率。这个框架相当于一个极小化极大的双方博弈。在任意函数G 和D

2017-07-29 19:50:38 447

转载算法研究、编程艺术、红黑树、数据挖掘、程序员面试5大系列集锦

前言开博已过20个月，回首这20个月，发现自己在本blog上着实花费了巨大的时间与精力，写的东西可能也够几本书的内容了。希望我真真正正的为读者提供了实实在在的价值与帮助。下面，敬请观赏。有任何问题，欢迎随时不吝指正(同时，若你也能帮助blog内留言的任何朋友的问题，欢迎你随时不吝分享&回复，我们一起讨论，互帮互助，谢谢)。无私分享，造福天下

2017-07-29 18:31:11 372

转载图像基本变换---图像二值化(包含OSTU/迭代法/统计法/双峰法/P分位法/最大熵法)

OSTU法图像二值化[算法说明] Ostu法又叫做最大类间方差法，是一种常用的图像分割算法。基本算法思想是根据初始阈值把图像分为两类，然后计算两类之间的方差，更新阈值，重新计算类间方差，当满足类间方差最大时的阈值，即为所求最佳阈值，具体过程如下： 1，初始化一阈值Th，将图像f(x,y)分为A，B两类； 2，分别计算A，B两类像素集合的均值ua和ub，公式如下：其

2017-07-29 18:00:44 1496

原创阈值化分割（二）OTSU法-附Python实现

一、OTSU法（大津阈值分割法）介绍 OTSU算法是由日本学者OTSU于1979年提出的一种对图像进行二值化的高效算法，是一种自适应的阈值确定的方法，又称大津阈值分割法，是最小二乘法意义下的最优分割。二、单阈值OTSU法设图像包含L个灰度级，灰度值为i的像素点个数为Ni，像素总点数为： N=N0+N1+⋯+NL−1则灰度值为i的点的概率为： Pi=Ni

2017-07-29 17:14:49 6196 1

原创阈值化分割（一）双峰法-附Python实现

一、双峰法介绍直方图双峰法（2-Mode method），如下图所示，即如果图像灰度直方图呈明显的双峰状，则选取双峰间的最低谷出作为图像分割的阈值所在。即下图中，以Zt为阈值进行二值化分割，可以将目标和背景分割开。但当图像的直方图出现波峰间的波谷平坦、各区域直方图的波形重叠等情况时，用双峰法就很找到合适的阈值。二、python源码下面给出Python源代码。

2017-07-29 17:10:43 4787 3

转载运动目标跟踪（二）--搜索算法预测模型之粒子滤波

原文：http://blog.csdn.net/jinshengtao/article/details/30970733推荐大家看论文《An adaptive color-based particle ﬁlter》这次我直接截图我的硕士毕业论文的第二章的一部分，应该讲得比较详细了。最后给出我当时在pudn找到的最适合学习的实现代码

2017-07-28 16:47:34 806

转载运动目标跟踪（一）--搜索算法预测模型之KF,EKF,UKF

这里先总体介绍下，原文转自：http://www.cnblogs.com/gaoxiang12/p/5560360.html任何传感器，激光也好，视觉也好，整个SLAM系统也好，要解决的问题只有一个：如何通过数据来估计自身状态。每种传感器的测量模型不一样，它们的精度也不一样。换句话说，状态估计问题，也就是“如何最好地使用传感器数据”。可以说，SLAM是状态估计的一个特例。 1.

2017-07-28 16:43:30 2593

转载光流（一）--综述概览

原文：http://blog.csdn.net/zouxy09/article/details/8683859 光流（optic flow）是什么呢？名字很专业，感觉很陌生，但本质上，我们是最熟悉不过的了。因为这种视觉现象我们每天都在经历。从本质上说，光流就是你在这个运动着的世界里感觉到的明显的视觉运动（呵呵，相对论，没有绝对的静止，也没有绝对的运动）。例如，当你坐在火车上，然后往窗外看。

2017-07-27 15:25:30 992

转载目标检测与跟踪

Paper ：https://github.com/foolwood/benchmark_results专栏：https://zhuanlan.zhihu.com/visual-tracking?group_id=840232915295170560重要网站链接：https://handong1587.github.io/deep_learning/2015/10/09

2017-07-27 15:09:28 555

原创 TLD跟踪算法(单目标)相关资料

一、目标跟踪TLD（Tracking-Learning-Detection）学习与源码理解之（一）TLD（Tracking-Learning-Detection）学习与源码理解之（二）TLD（Tracking-Learning-Detection）学习与源码理解之（三）TLD（Tracking-Learning-Detection）学习与源码理解之（四）TLD（Tracking

2017-07-27 14:59:21 345

转载 SIFT算法原理解析

首先找到图像中的一些“稳定点”，这些点是一些十分突出的点不会因光照条件的改变而消失，比如角点、边缘点、暗区域的亮点以及亮区域的点，既然两幅图像中有相同的景物，那么使用某种方法分别提取各自的稳定点，这些点之间会有相互对应的匹配点，正是基于这样合理的假设，SIFT算法的基础是稳定点。SIFT算法找稳定点的方法是找灰度图的局部最值，由于数字图像是离散的，想求导和求最值这些操作都是使用滤波器，而滤波器是有

2017-07-27 09:01:20 767

原创 boost教程

由于项目需要，最近在学习boost 类库，在github上创建了一个boost_tutorial项目，欢迎有兴趣的同学丰富。boost::thread 的用法如下，更多项目请移步boost_tutorial，其它将在github上陆续更新：[cpp] view plain copy /* * boost::thread tutorial * * z

2017-07-25 17:54:27 795

转载模糊决策--机器人壁障

翻出了自己以前的小程序，居然还有人要，就共享一下 1、程序要求平面上有布满障碍物，设定起始点和终点。一个机器人从起点运动到终点，经过最短路径不与障碍物发生碰撞。起点和终点由用户指定，障碍物的个数和形状可以随机生成，存储在文件中读出或者由用户指定生成。机器人为圆型机器人，在头部正中配有7个传感器，以正中为界限跟别为0度，+-5度，+-15度，+-90度，传感器感知范围为3个机器人直

2017-07-25 17:50:56 720 1

转载草图检索和识别[开源]

山间岁月容易过，世上繁华已千年。转眼之间，我已经在大学呆了七年了。七年来忧世伤生。回想三年前自定的训练目标：把论文变成程序的能力。从《SIFT算法详解》到OpenSSE 都是基于这么一个想法。今天终于有空把它整理了一下，放在了Github上，希望以后能有时间，好好的写一份像SIFT一样详细的文档。不过，我更多的精力将会放到下一个目标的训练上：把程序变成产品的能力。希望一切顺利！草图检索

2017-07-25 17:47:37 555

转载高斯模糊实现小结

注：博客中图表的大小难以调整，导致阅读不便，这里有其pdf版本：高斯模糊实现小结.pdf广告：如果科研累了，静下心来读一本好书吧：《琅琊榜》高斯模糊是一种图像滤波器，它使用正态分布(高斯函数)计算模糊模板，并使用该模板与原图像做卷积运算，达到模糊图像的目的。N维空间正态分布方程为：其中，σ是正态分布的标准差，σ值越大，图像越模糊(平滑)。r为模糊半径，模糊半径是指模板元素

2017-07-25 17:44:09 418

原创 SIFT算法详解

尺度不变特征变换匹配算法详解Scale Invariant Feature Transform(SIFT)Just For Funzdd [email protected] or ([email protected])对于初学者，从David G.Lowe的论文到实现，有许多鸿沟，本文帮你跨越。如果你学习SIFI得目的是为了做检索，也许 OpenSSE 更适合你，欢迎使用。

2017-07-25 17:33:25 386

转载 SIFT特征提取分析

SIFT（Scale-invariant feature transform）是一种检测局部特征的算法，该算法通过求一幅图中的特征点（interest points,or corner points）及其有关scale 和 orientation 的描述子得到特征并进行图像特征点匹配，获得了良好效果，详细解析如下：算法描述SIFT特征不只具有尺度不变性，即使改变旋转角度，图像亮度或拍摄

2017-07-25 17:30:00 307

原创虹膜识别之区域生长法

区域生长方法是根据同一物体区域内象素的相似性质来聚集象素点的方法，从初始区域（如小邻域或甚至于每个象素）开始，将相邻的具有同样性质的象素或其它区域归并到目前的区域中从而逐步增长区域，直至没有可以归并的点或其它小区域为止。区域内象素的相似性度量可以包括平均灰度值、纹理、颜色等信息。区域生长方法是一种比较普遍的方法，在没有先验知识可以利用时，可以取得最佳的性能，可以用来分割比较复杂的图象，如自

2017-07-25 15:33:47 605

原创图像差分的方法

差分图像的几个方法2017/7/25在处理图像的时候，特别是处理视频流图像的时候，往往会用到图像差分的方法。顾名思义，图像差分，就是把两幅图像的对应像素值相减，以削弱图像的相似部分，突出显示图像的变化部分。例如，差分图像往往能够检测出运动目标的轮廓，能够提取出闪烁导管的轨迹等等。那么，该如何对图像进行差分呢，或者说输入一个视频流，如何进行差分处理呢。

2017-07-25 09:45:49 6142

原创 Going deeper with convolutions-GoogLeNet（阅读）

本篇论文是针对ImageNet2014的比赛，论文中的方法是比赛的第一名，包括task1分类任务和task2检测任务。本文主要关注针对计算机视觉的高效深度神经网络结构，通过改进神经网络的结构达到不增加计算资源需求的前提下提高网络的深度，从而达到提高效果的目的。目的：提升深度神经网络的性能。一般方法带来的问题：增加网络的深度与宽度。带来两个问题：（1）参

2017-07-24 14:02:46 1311

原创 OCR识别的开源分析

OCR识别的开源分析OCR软件主要是由下面几个部分组成。　　1. 图像输入、预处理：　　2. 图像输入：对于不同的图像格式，有着不同的存储格式，不同的压缩方式。预处理：主要包括二值化，噪声去除，倾斜较正等　　3. 二值化：　　对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为了让计算机更快的，更好的识别文字，我们

2017-07-21 22:09:10 1797

转载局部二值模式LBP（Local Binary Pattern）实现代码

局部二值模式LBP由于其简单、高效在目标检测、目标识别、图像检索等领域得到了广泛的应用。现如今，LBP的变体不下上十种，如VLBP、SILBP等。要了解更多关于LBP的知识可以参考：纹理分类-全局特征LBP及相关文献。下面介绍的三种LBP算子的区别见下图：本文不介绍LBP的理论知识，只是简单的说说LBP及其变体的实现：

2017-07-20 14:29:49 1047

原创行人检测(Pedestrian Detection)资源与更新

行人检测相关的网站链接： [1]、Caltech Pedestrian Detection Benchmark： http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/ [2]、People-Tracking-by-Detection and People-D

2017-07-20 14:25:47 1015

转载关于颜色、纹理和分层的目标检测（object detect)相关论文

最近在看目标检测方面的文章，主要集中在颜色、纹理和分层，解决实际中遇到的问题。特将收集到的文章进行分享，并附有简单的介绍，文章在google scholar可以下到（也可以通过后面连接下载：http://download.csdn.NET/detail/kezunhai/5283117）.1. Real-Time Moving Object Detection for Video Surv

2017-07-20 14:24:30 595

转载 cvpr常用资源整理

文章出处：http://www.cnblogs.com/tornadomeet 欢迎转载或分享，但请务必声明文章出处。跟OpenCV相关的：http://opencv.org/2012年7月4日随着opencv2.4.2版本的发布，opencv更改了其最新的官方网站地址。http://www.opencvchina.com/好像12年才有这个论坛的，比较

2017-07-20 14:23:04 444

转载整理CVPR2012感兴趣的文章

文章来自：http://www.bfcat.com/index.php/2012/04/cvpr2012-papers/ 看了一下CVPR2012的papers on the web，很多文章的链接都还没有出来。根据题目，挑选了几篇感兴趣的。关注一下。有一些链接papers on the web还没有公布，自己上网搜了一下。其他的就等着不定时更新吧。今年国内的文章不少啊，

2017-07-20 14:22:20 465

转载 Adaptive Compressive Tracking via Online Vector Boosting Feature Selection（ACT算法解读）

2017-07-20 14:10:44 380

原创 Tracking-Learning-Detection （TLD算法总结）

一、TLD算法简介TLD(Tracking-Learning-Detection)是英国萨里大学的一个捷克籍博士生ZdenekKalal在2012年7月提出的一种新的单目标长时间跟踪算法。该算法与传统跟踪算法的显著区别在于将传统的跟踪算法和传统的检测算法相结合来解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。同时，通过一种改进的在线学习机制不断更新跟踪模块的“显著特征点”和检测模块

2017-07-20 14:08:47 865

翻译 Survey of single-target visual tracking methods based on online learning 翻译

基于在线学习的单目标跟踪算法调研摘要视觉跟踪在计算机视觉和机器人学领域是一个流行和有挑战的话题。由于多种场景下出现的目标外貌和复杂环境变量的改变，先进的跟踪框架就有必要采用在线学习的原理。本论文简要的介绍了一下关于视觉跟踪的挑战和应用，通过分类集中讨论基于在线学习的现代跟踪方法。我们提供了对每种分类中的代表性方法的详细描述，同时检查它们的优点和缺点。而且，一些最具代表性的算法被实现，来提供

2017-07-20 13:51:48 570

转载【机器学习】【计算机视觉】数据挖掘测试数据集大全

数据挖掘测试数据集大全关于源代码，网上有很多公开源码的算法包，例如最为著名的Weka，MLC++等。Weka还在不断的更新其算法，下载地址：http://www.cs.waikato.ac.nz/ml/weka/ftp://pami.sjtu.edu.cnhttp://www.ics.uci.edu/~mlearn/MLRepository.htmstatlib

2017-07-20 09:26:23 632

转载【机器学习】【计算机视觉】非常全面的图像数据集

1.搜狗实验室数据集：http://www.sogou.com/labs/dl/p.html互联网图片库来自sogou图片搜索所索引的部分数据。其中收集了包括人物、动物、建筑、机械、风景、运动等类别，总数高达2,836,535张图片。对于每张图片，数据集中给出了图片的原图、缩略图、所在网页以及所在网页中的相关文本。200多G2http://www.imageclef.org/

2017-07-20 09:24:40 1718

原创 [数据结构] 数组与链表的优缺点和区别

概述　　数组　是将元素在内存中连续存放，由于每个元素占用内存相同，可以通过下标迅速访问数组中任何元素。但是如果要在数组中增加一个元素，需要移动大量元素，在内存中空出一个元素的空间，然后将要增加的元素放在其中。同样的道理，如果想删除一个元素，同样需要移动大量元素去填掉被移动的元素。如果应用需要快速访问数据，很少插入和删除元素，就应该用数组。　　链表　中的元素在内存中不是顺序存储的，而

2017-07-19 22:59:54 506

原创欠拟合、过拟合及其解决方法

在我们机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了，这个问题也在学术界讨论的比较多。（之前搜了很多有的博客，讲的都不太全，因此我重新整理总结了一遍，同时加入了自己的理解，方便自己和后来人查阅）首先就是

2017-07-19 11:48:54 410

转载视觉工程师笔试知识汇总

总结以下前些天做的笔试题。一. 笔试题笔试题罗列如下，大多都是去年师兄屡次杯具的见证，深表感谢，哈哈。试题以视觉工程师为主，部分是机器人或机器学习岗位。Autel Robotics软件类笔试题BaiDu视觉算法工程师笔试题DJI视觉工程师DJ机器学习工程师DeepGlint计算机视觉公司机试题SenseTime工程类笔试题PowerV

2017-07-19 11:48:02 848

转载虹软校招笔试题--算法岗

虹软对算法岗的要求：1、硕士及以上学历，图像处理、计算机视觉、模式识别、电子电路、电气工程、嵌入式、软件工程相关专业研究方向；2、熟悉当前流行的计算机视觉与模式分类理论以及常用的统计和学习方法：PCA、Boosting、SVM、Neural Net、Regression等； 3、熟悉常用特征提取方法：Haar、Gabor、LBP、SIFT、HOG等；深厚的数学功底与算法理论研究

2017-07-19 10:43:32 2262

Distributed Computing.pdf

YaleB人脸数据库

connection。jar

空空如也