xiamentingtao-CSDN博客

原创 faster rcnn在自己的数据集上训练

本文是一个总结，参考了网上的众多资料，汇集而成，以供自己后续参考。一般说来，训练自己的数据，有两种方法：第一种就是将自己的数据集完全改造成VOC2007的形式，然后放到py-faster-rcnn/data 目录下，然后相应地改变相应模型的参数，比如种类等。 data目录下存放的数据如下：VOCdevkit2007 └── VOC2007 ├── Annotations │

2017-11-13 18:44:43 1506 2

转载 Iris recognition papers in the top journals in 2017

转载自：https://kiennguyenstuff.wordpress.com/2017/10/05/iris-recognition-papers-in-the-top-journals-in-2017/Top journals:– IEEE Transaction on Pattern Analysis and Machine Intelligence (PAM

2017-11-10 17:47:13 965

原创 faster rcnn学习之rpn 的生成

接着上一节《 faster rcnn学习之rpn训练全过程》，假定我们已经训好了rpn网络，下面我们看看如何利用训练好的rpn网络生成proposal.其网络为rpn_test.pt# Enter your network definition here.# Use Shift+Enter to update the visualization.name: "VGG_CNN_M_102

2017-11-08 23:05:53 1458 1

原创 faster rcnn学习之rpn训练全过程

上篇我们讲解了rpn与fast rcnn的数据准备阶段，接下来我们讲解rpn的整个训练过程。最后讲解rpn训练完毕后rpn的生成。我们顺着stage1_rpn_train.pt的内容讲解。name: "VGG_CNN_M_1024"layer { name: 'input-data' type: 'Python' top: 'data' top: 'im_info'

2017-11-08 18:55:29 13797

原创 faster rcnn学习之rpn、fast rcnn数据准备说明

在上文《 faster-rcnn系列学习之准备数据》,我们已经介绍了imdb与roidb的一些情况，下面我们准备再继续说一下rpn阶段和fast rcnn阶段的数据准备整个处理流程。由于这两个阶段的数据准备有些重合，所以放在一起说明。我们并行地从train_rpn与train_fast_rcnn说起，这两个函数在train_faster_rcnn_alt_opt.py中。def tra

2017-11-08 13:57:12 3832 1

minibatch.py 的功能是： Compute minibatch blobs for training a Fast R-CNN network. 与roidb不同的是， minibatch中存储的并不是完整的整张图像图像，而是从图像经过转换后得到的四维blob以及从图像中截取的proposals，以及与之对应的labels等在整个faster rcnn训练中，有两处用到了minibatch

2017-11-06 23:48:33 3719

原创 py-faster-rcnn代码roidb.py的解读

roidb是比较复杂的数据结构，存放了数据集的roi信息。原始的roidb来自数据集，在trian.py的get_training_roidb(imdb)函数进行了水平翻转扩充数量，然后prepare_roidb(imdb)【定义在roidb.py】为roidb添加了一些说明性的属性。在这里暂时记录下roidb的结构信息，后面继续看的时候可能会有些修正：roidb是由字典组成的li

2017-11-05 19:58:32 2934

转载 faster-rcnn系列学习之准备数据

如下列举了将数据集做成VOC2007格式用于Faster-RCNN训练的相关链接。RCNN系列实验的PASCAL VOC数据集格式设置制作VOC2007数据集用于Faster-RCNN训练将数据集做成VOC2007格式用于Faster-RCNN训练这一篇比较详细地介绍了如何制造voc2007的所有文件，内含相关软件和代码，值得一看。voc2007数据集的下载和解压

2017-11-05 15:39:20 3387

原创 caffe 初学参考链接

最近在学习caffe，也搜集了一些资料，主要是一些网上公开的博客资源，现汇总一下，以便后面参考。caffe 安装编译py-faster-rcnn全过程caffe依赖库安装（非root）编译py-faster-rcnn的问题汇总及解决方法caffe 基本架构python版本 Caffe for Python 官方教程(翻译)官方提供的示例官方提供的示例注释版caffe 模型微调py

2017-10-29 22:09:00 492

原创 conda环境管理介绍

我们可以使用conda 来切换不同的环境，主要的用法如下： 1. 创建环境 # 指定python版本为2.7，注意至少需要指定python版本或者要安装的包# 后一种情况下，自动安装最新python版本 conda create -n env_name python=2.7 # 同时安装必要的包conda create -n env_name numpy matplotlib pytho

2017-10-28 15:43:36 2749

原创如何修改PKG_CONFIG_PATH环境变量

两种情况，如果你只是想加上某库的pkg，则选择下面其一：export PKG_CONFIG_PATH=/usr/lib/pkgconfig/ 或者 export PKG_CONFIG_LIBDIR=/usr/lib/pkgconfig/ 如果你想覆盖掉原来的pkg,选择后者。因为：PKG_CONFIG_LIBDIR的优先级比 PKG_CONFIG_PAT

2017-10-27 23:58:18 43821

原创 R-CNN detection 运行问题及办法

运行caffe官方提供的jupyter 的rcnn detection，总是出现各种问题。先将问题及方法汇集在此： 1. Selective Search 的安装问题按照官网，我下载了selective_search_ijcv_with_python，但是在我的linux matlab2017a上总是出现问题，`Error using CountVisualWordsIndex (l

2017-10-26 20:55:10 1176 5

原创由Google Protocol Buffer的小例子引起的g++编译问题

问题学习 Google Protocol Buffer 的使用和原理时，提供了一个小例子，讲述了protobuf的使用方法。假如已经有了如下文件：其中writer.cpp如下：#include "lm.helloworld.pb.h"#include<iostream>#include<fstream>using namespace std; int main(void)

2017-10-25 11:34:52 2167

转载 Makefile中 -I -L -l区别

转载自：http://blog.csdn.net/davion_zhang/article/details/41805641我们用gcc编译程序时，可能会用到“-I”（大写i），“-L”（大写l），“-l”（小写l）等参数，下面做个记录：例：gcc -o hello hello.c -I /home/hello/include -L /home/hello/lib -lworld上

2017-10-23 20:15:31 320

转载 /usr/lib/libstdc++.so.6: version `GLIBCXX_3.4.15' not found错误的解决

转载自：http://www.cnblogs.com/weinyzhou/p/4983306.html升级cmake时，提示“Error when bootstrapping CMake:Problem while running initial CMake”，第二次运行./bootstrap时，直接的给出了错误原因：12345678[roo

2017-10-23 15:14:01 1145

原创【论文阅读】Illuminating Pedestrians via Simultaneous Detection & Segmentation

论文来源ICCV2017 arXiv reportgithub代码(caffe-matlab)本文的主要问题是行人检测。作者探讨了如何将语义分割应用在行人检测上，提高检测率，同时也不损坏检测效率。作者提出了一种语义融合网络（segmentation infusion networks）去促进在语义分割与行人检测上的联合监督。其中行人检测为主要任务，语义分割主要起到了矫正，指导共享层的特征生成

2017-10-22 15:26:37 2336 1

原创图像极坐标变换及在OCR中的应用

极坐标变换定义我们知道在二维坐标系中，有直角坐标系，也有极坐标系，二者的转换关系是：如下图：如图，直角坐标系的圆心与极坐标系的圆心一一对应，且圆弧BA可以通过极坐标变换到极坐标系ρ=r\rho=r的一条直线上，实现由圆形到直线的转换。这往往在一些图像处理中很有用。实际上，我们在图像处理中，往往还不是处理这样的圆弧，而更多的是处理圆环区域。如下，同理，我们可以把（a

2017-10-22 14:53:36 4434

原创 softmax logistic loss详解

softmax函数–softmax layersoftmax用于多分类过程中，它将多个神经元的输出，映射到（0,1）区间内，可以看成概率来理解，从而来进行多分类！假设我们有一个数组z=(z1,z2,...zm)z=(z_1,z_2,...z_m),则其softmax函数定义如下： σi(z)=exp(zi)∑mj=1exp(zj),i=1,2..,m\sigma_i(z)=\frac{exp(z

2017-10-22 13:56:01 4656

原创编译py-faster-rcnn全过程

编译py-faster-rcnn，花费了好几天，中间遇到好多问题，今天终于成功编译。下面详述我的整个编译过程。【注记：】其实下面的依赖库可以安装在统一的一个本地目录下，相关安装指南，可以参考《深度学习：21天实战caffe》的第5天那一章。（这也是我后来才知道的。）部分软件见百度云盘：链接: https://pan.baidu.com/s/1i4DNpU9 密码: shgt

2017-10-19 12:23:30 4357 2

转载 nvidia显卡对比分析

本文章转载自：http://www.cnblogs.com/lijingcong/p/4958617.html科学计算显卡的两个主要性能指标：1、CUDA compute capability，这是英伟达公司对显卡计算能力的一个衡量指标；2、FLOPS 每秒浮点运算次数，TFLOPS表示每秒万亿（10^12）次浮点计算；3、另外，显存大小也决定了实验中能够使用的样本数量和模型复

2017-10-19 10:15:14 2698

原创 linux 安装python-opencv

三种方法：1. pip 安装：pip install opencv-python ，最新版为opencv3安装后>>> import cv2>>> print cv2.__version__参考：http://www.cnblogs.com/lclblack/p/6377710.html2. anaconda的conda安装 ,可以指定opencv版本，如o

2017-10-18 22:15:13 17432 2

原创编译py-faster-rcnn的问题汇总及解决方法

按照官网的提示，我开始安装faster rcnn，但是出现了很多问题，我将其汇总了起来，并提出了解决办法。先说明一下我的配置：python : anaconda2linux: centos 6.9安装faster rcnn请先参考：《cuda8+cudnn4 Faster R-CNN安装塈运行demo》与《使用cuDNN5编译py-faster-rcnn错误：cudnn.hpp(1

2017-10-17 20:52:32 7363 3

转载 cuda、cudnn相关问题链接

1. cuda，cudnn安装2. 查看已有的cuda等版本cuda 版本 cat /usr/local/cuda/version.txtcudnn 版本 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 23. cudnn的安装，路径和版本问题http://blog.csdn.net/

2017-10-17 10:39:06 634

原创 centos 安装boost(caffe需要)

安装由于安装caffe，要求boost的版本在1.55以上，而服务器上的刚好是1.54,所以进行了重装。参考：《CentOS 7下编译安装Boost_1_57_0 》不过由于pycaffe需要boost.python,因此需要在./b2时修改为./b2 –stage debug 才可以。而不能去掉python.显示boost版本：进入boost的lib64目录下，显然如下的版本为1.65

2017-10-05 20:46:44 2429

原创 centos 安装 MatConvNet （gpu）

1. 安装准备 matlab2017a ，参考：《centos 安装matlab2017a(无root权限)》 GCC 4.8(支持c++11) 键入：sudo yum install gcc gcc-c++ （建议sudo装）至少CUDA 7.5，（本人选择cuda8.0） CuDNN v4 （与cuda8对应，选择cudnn v5.0） Lib

2017-10-05 10:27:32 1366 2

转载 Caffe训练过程：test_iter test_interval等概念

转载自http://blog.csdn.net/iamzhangzhuping/article/details/49993899先上一张图，大家很熟悉的一张图。首先说明一个概念：在caffe中的一次迭代iteration指的是一个batch，而不是一张图片。下面主要说下2个概念： test_iter：在测试的时候，需要迭代的次数，即test_iter* batch

2017-09-29 17:24:56 2762

原创 win7+vs2015/13+caffe+matlab+python（CPU only）配置

caffe 在vs2015的安装教程

2017-09-29 13:08:19 2535

原创 matlab 配置mex 识别vs2015

问题：先安装了matlab，后装了vs13和vs15,但是mex -setup时却不能识别vs15，采用了两种办法，最终得以识别。解决方案：先采用方法：http://blog.csdn.net/yc461515457/article/details/51635842 ，但是没解决问题，后面采用了http://blog.csdn.net/hzd12368/article/detail

2017-09-14 15:52:23 9165 3

转载出现23.97帧率的原因

http://raytao.lofter.com/post/3d177_185a386关于那些“格（Frame）”不得不说的事今天早上，鄙人在社交网络发了这一系列的问题：请解释以下名词之间的关系或差异。帧，格，帧率，时基，升格，降格；Timecode、frame、fps、3:2 pulldown……以上这些内容绝非无聊之举。实际是有鉴于这半年以来，工

2017-04-20 14:10:11 4678

原创 c++实现解析文件路径

注意：本实现只能解析类似linux下的路径，即“/data/a.txt”，而不能解析“c:\a.txt” 或者“c:\\a.txt”，但是应该很容易扩展改写实现此功能。FilepathParse.h#include using std::string;void parseFilepath(string filepath, string &path, string &filen

2017-04-18 22:05:32 2994

转载 C++ STL中set底层实现方式

Q：STL中set底层实现方式？为什么不用hash？A: 第一个问题:set底层实现方式为RB树（即红黑树）。第二个问题: 首先set，不像map那样是key-value对，它的key与value是相同的。关于set有两种说法，第一个是STL中的set，用的是红黑树；第二个是hash_set，底层用得是hash table。红黑树与hash table最大的

2017-02-17 16:53:41 20231 1

转载 C++中虚析构函数的作用

C++中的虚析构函数到底什么时候有用的，什么作用呢。总的来说虚析构函数是为了避免内存泄露，而且是当子类中会有指针成员变量时才会使用得到的。也就说虚析构函数使得在删除指向子类对象的基类指针时可以调用子类的析构函数达到释放子类中堆内存的目的，而防止内存泄露的。我们知道，用C++开发的时候，用来做基类的类的析构函数一般都是虚函数。可是，为什么要这样做呢？下面用一个小例子来说明：

2017-02-17 16:48:26 2206

转载 c++ 虚函数的实现机制

转载自：http://blog.csdn.net/jiangnanyouzi/article/details/37208071、c++实现多态的方法其实很多人都知道，虚函数在c++中的实现机制就是用虚表和虚指针，但是具体是怎样的呢？从more effecive c++其中一篇文章里面可以知道：是每个类用了一个虚表，每个类的对象用了一个虚指针。具体的用法如下：class

2017-02-17 16:37:38 639

转载 c++11中的智能指针

在C++11中有四种智能指针，auto_ptr，shared-ptr，unique_ptr和weak-ptr，其中auto_ptr有许多不足之处，在C++11中已经建议废弃使用。1. shared_ptr std::shared_ptr智能指针可以通过共享指向对象的所有权，从而实现对对象的动态管理。std::shared_ptr一般不会拥有对象，相反，所有指向对象的std::shar

2017-02-17 15:31:11 738

原创基于几何距离的椭圆拟合

问题给定离散点集Xi=(xi,yi)X_i=(x_i,y_i)，我们希望找到最好的椭圆去拟合这些离散点。方法通常我们使用最小二乘法求解如下的最优化问题：Min∑i=1Nf(xi,E)2Min \sum_{i=1}^N f(x_i,E)^2 这里f(xi,E)f(x_i,E) 表示点xix_i 到E（指待拟合的椭圆）的最小距离。通常我们有两种方法来表达f(xi,E)f(x_i,E) ，分别是：几

2017-02-08 23:24:43 9316 8

原创基于代数距离的椭圆拟合

问题给定离散点集Xi=(xi,yi),i=1,2,...NX_i=(x_i,y_i) ,i=1,2,...N，我们希望找到误差最小的椭圆去拟合这些离散点。方法由于椭圆的形式可以给定，自然我们将使用最小二乘法来求解椭圆。主要依据论文《Direct least squares fitting of ellipsees, Fitzgibbon, Pilu and Fischer in Fitzgibb

2017-02-08 22:25:50 5572 5

转载有关eigen库的一些基本使用方法

目录介绍安装Demo矩阵、向量初始化C++数组和矩阵转换矩阵基础操作点积和叉积转置、伴随、行列式、逆矩阵计算特征值和特征向量解线性方程最小二乘求解稀疏矩阵介绍Eigen是一个轻量级的矩阵库,除了稀疏矩阵不成熟（3.1有较大改进）以外,其他的矩阵和向量操作都

2017-01-11 10:51:05 9353

原创 fatal error LNK1169: 找到一个或多个多重定义的符号的解决方案

昨天，尝试一个项目，遇到了如下的问题。先来还原一下：头文件test.h#pragma once#include #include using namespace Eigen;using namespace std;class point2{public:point2(int x1,int y1):x(x1),y(y1){}point2& operator+

2017-01-11 10:35:53 70454 10

原创 DebugView输出调试信息

在写windows程序时，需要输出一些调试信息，这里介绍一种极其方便的方法。即使用OutputDebugString 在Debug模式下输出调试信息，在Release模式下不输出。我们可以在VS的集成平台上输出调试信息，也可以使用DebugView来查看调试信息。1.)DebugView图文教程 1、DbgView界面和监控方法打开软件后，顶部工具栏中选

2016-12-22 13:27:48 7144

原创 RANSAC算法注记

今天学习了一下RANSAC随机样本一致性算法，其在图像融合、特征点匹配方面有很强大的应用。网上已经有很多人写了关于这方面的文档，就不再造轮子了。特此罗列出来，以供后续参考。我的数学之美（一）——RANSAC算法详解这篇文章很基本地讲述了RANSAC算法的基本概念。RANSAC算法原理与源码解析本篇文章讲述了在opencv特征点匹配过程中ransac算法滤除误匹配的详细思路。其中讲到：Op

2016-11-04 21:56:28 1146

batch-resize

一个批量调整图像大小的工具

2024-04-07

Neurotechnology 的python虹膜识别试用版接口文件

2023-07-25

test_demo.zip

Pytorch的C++接口实践demo，改编自https://blog.csdn.net/gulingfengze/article/details/92013360，不过我们这里没有使用cmake，而是直接在VS上配置。

2019-08-06

matlab_caffe_cpu_vs2015_matlab_2016_py35.zip

我自己编译好的matcaffe，使用时请参考： https://blog.csdn.net/wangkun1340378/article/details/72917724

2019-06-23

face alignment using opencv+LBF

提供了一个人脸视频，训练好的人脸检测模型和人脸关键点检测模型，以及一个人脸关键点检测的工程

2018-10-31

vs2015编译好的opencv4.0.0包

我们编译好的包不仅包含了原始的opencv4.0.0,而且包含了opencv_contrib的最新提交。

2018-10-31

使用extern "C"改善显式调用dll的例子（c++）

使用extern "C"改善显式调用dll的例子

2016-04-04

使用extern "C"改善显式调用dll的例子

使用extern "C"改善显式调用dll的例子.里面包含了显示与隐式调用dll的例子，而且dll是c风格的

2016-04-04

ffmpeg-3.0

安装指南：http://blog.csdn.net/redstarofsleep/article/details/45092145

2016-03-12

ippicv_linux_20151201

linux下安装opencv3.1.0必备库

2016-03-12

基于空间几何变换的人脸对齐(Matlab内置函数

本文讲解了基于三点和两点的人脸对齐，使用了matlab的内置函数。

2016-03-05

doxygen安装工具

doxygen：http://www.stack.nl/~dimitri/doxygen/index.html Graphviz ：http://www.graphviz.org/Download_windows.php记得选择windows下的版本哟 “Stable and development Windows Install packages” htmlhelp：http://www.create-chm.com/chm-help-compiler/ 以上皆为windows下的版本

2015-11-08

2.46公式推导有误，应该改为

2014-12-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

batch-resize

Neurotechnology 的python虹膜识别试用版接口文件

test_demo.zip

matlab_caffe_cpu_vs2015_matlab_2016_py35.zip

face alignment using opencv+LBF

vs2015编译好的opencv4.0.0包

使用extern "C"改善显式调用dll的例子 （c++）

使用extern "C"改善显式调用dll的例子

ffmpeg-3.0

ippicv_linux_20151201

基于空间几何变换的人脸对齐(Matlab内置函数

doxygen安装工具

2.46公式推导有误，应该改为

使用extern "C"改善显式调用dll的例子（c++）