自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(43)
  • 资源 (3)
  • 收藏
  • 关注

原创 基于RGB图像的手势估计(Hand Pose Estimation )文献综述

一、手势估计研究难点1. 场景手分辨率低(Low-res hand) 背景杂乱(Clutter background) 手与其它对象交互(Object/surface interaction) 手被遮挡(Occlusions/Self-occlusions)2. 形态不同手势相似(Self-similarity) 多自由度(many DoF(Degree of Freedom...

2018-08-03 20:24:08 8678 2

原创 Linux下编译时找不到.so文件 解决方法

在linux中.so文件为共享函数库文件,用于动态连接,相当于windows下的dll。如有编译时依赖较多的情况,很容易出现找不到.so文件的错误。这类错误的常见提示类型://usr/lib/x86_64-linux-gnu/libSM.so.6: undefined reference touuid_generate@UUID_1.0'/usr/bin/ld: cannot fi...

2019-07-19 19:56:56 6588

原创 C++ string 用法总结

1、获取长度,使用str.length()方法2、查找子串位置,使用str.find(string substr)方法find_first_of / find_last_of:返回子串出现在母串中的首次出现的位置,和最后一次出现的位置。3、根据位置获取子串,使用str.substr(int startpos, int length),字符串头位置序号为04、根据关键字分割字符串(s...

2019-07-12 17:54:30 307

原创 数据集自动生成图片路径索引目录

$ find ./dataset/ -name type1_*.jpg >> images_type1.txt$ find ./dataset/ -name type2_*.jpg >> images_type2.txt

2019-07-05 19:26:25 913

原创 Linux下Jsoncpp的安装和使用

使用C++处理JSON格式的数据时,可以使用跨平台的开源库Jsoncpp。本文介绍Linux环境下Jsoncpp安装和编译,系统是Ubuntu 16.04使用apt-get进行安装sudo apt-get libjsoncpp-dev libjsoncpp安装好后,可以看到对应的版本号其头文件所在路径是:/usr/include/jsoncpp/json动态库在:/usr/l...

2019-06-27 10:21:28 6973

原创 Linux下Gtest的安装与使用

一、安装Gtest1、下载最新版gtest源码git clone https://github.com/google/googletestcd googletest/googletest2、编辑CMakeLists.txt文件,将option(BUILD_SHARED_LIBS “Build shared libraries (DLLs).” OFF)中的OFF改为ON3、编译...

2019-06-21 17:16:41 6239

原创 ROS使用记录

ROS 全名 Robot Operating System,指机器人操作系统。本文记录学习ROS过程的一些笔记。1、rosbag文件可以存储采集到的数据。重新使用rosbag中数据的步骤如下:首先启动一个终端作为主机roscore启动一个新的终端接受数据。进入工程目录,然后键入如下命令source devel/setup.bashroslaunch launch/exam...

2019-06-18 20:32:19 263

原创 Ubuntu 16.04 装机与cuda环境配置

工作站预装的Windows,由于开发需要,装了Ubuntu的双系统。本文记录一下装机与配置过程中踩过的坑。一、安装Ubuntu1、首先在磁盘管理中为新系统留出足够的分区大小。然后下载好所需版本的Ubuntu系统镜像,用Rufus和一个大于4G的U盘制作好启动盘。重启机器并进入BIOS页面(不同品牌电脑方式略有不同,戴尔是F12),选择UEFI进入U盘启动盘,选择install Ubuntu...

2019-06-06 15:07:31 728

原创 Git 远程多分支协作及问题解决记录

预备工作配置用户信息:$ git config --global user.name "John Doe"$ git config --global user.email [email protected]检查配置信息:git config user.namegit config user.emailgit config --list一、本地常用操作提...

2019-03-20 21:48:10 505

原创 Windows下COCOAPI的安装

Requirement:Visual Studio 2015 +1、下载源码,解压并进入该目录。源码地址:https://github.com/cocodataset/cocoapi2、进入./PythonAPI, 编辑setup.py,去掉第12行extra_compile_args中前两个多余的参数3、执行命令python setup.py build_ext --inpla...

2019-03-14 22:01:24 2908 1

原创 Tensorflow + Keras 运行Mask-RCNN

源码地址:https://github.com/matterport/Mask_RCNN实验环境:Ubuntu + tensorflow1.4 + cuda8.0 + python3.5 + Keras2.1 前几天在tensorflow上测试了MaskRCNN,见https://blog.csdn.net/BockSong/article/details/82690343但这个r...

2018-09-19 17:09:13 1557 2

原创 Python中多进程进行数据处理

在做大量数据的处理时,经常会遇到速度慢的问题,这时候可以使用多进程来进行加速。python中的multiprocessing提供了跨平台的多进程模块,这里使用其中的pool(进程池)来尝试。from multiprocessing import Pool def run(data): # do something return dataprocessor = 8re...

2018-09-18 20:40:30 1737

原创 Git冲突解决

这次git使用中,本地做了修改并提交了commit但没有及时push,等到别人push后没有进行检查直接进行了push,git自动merge然后出现了冲突。当时push完后没注意git提示,打开本地文件发现出现了冲突的提示,具体格式是:<<<<<<<到=======是在当前分支合并之前的文件内容=======到>>>>&g...

2018-09-16 13:07:11 336

原创 Tensorflow上运行MaskRCNN

源码地址:https://github.com/CharlesShang/FastMaskRCNN实验环境:Linux + cuda8.0 + cudnnv5.1 + python2.7步骤按照文档来,不再赘述。中间遇到了一些问题,这里做一下记录。解决过程中参考了repo issue及以下资料:https://blog.csdn.net/linolzhang/article/detai...

2018-09-13 17:24:37 1366

原创 Caffe Loss Layer小结

首先梳理一下一些常用的loss层。1.SoftmaxWithLoss对一对多的分类任务计算多项逻辑斯蒂损失,并通过softmax传递预测值,来获得各类的概率分布。该层可以分解为SoftmaxLayer+MultinomialLogisticLossLayer,但它的梯度计算在数值上更为稳健。在测试时,该层可用SoftmaxLayer替代。2.EuclideanLoss对回归任务计算...

2018-09-05 11:46:07 442

原创 Caffe Batchnorm层使用小结

首先回顾一下batch normalization的原理。BN主要原理是使得每一层的输出的分布相同,从而让网络的每一层不必再因为需要学习数据分布上的不同而受到影响。BN的好处包括允许网络使用较高的学习率,能够起到一定的regularization的作用等等,从而加速训练。一般来讲BN layer可以放在FC layer或conv layer的后边,数据量大或复杂的情况下可以每层都放。也有说法认...

2018-09-04 16:06:29 1309

原创 Caffe可视化总结

1、网络结构可视化可以使用:https://dgschwend.github.io/netscope/quickstart.htmlNetscope是一个功能强大的在线工具,不仅可以将网络结构可视化,还可以对网络进行详尽的分析,计算ops、mem等(不支持一些特殊的层),是一个分析结构的有力帮手。2、loss分析及可视化2.1 绘制loss曲线loss可视化有多种方式,例如使用...

2018-08-23 16:11:21 546

原创 Linux下非root用户环境变量使用小结

环境变量是指操作系统或程序执行时候默认设定的参数,比如path路径变量,或者说是当要执行某个命令或程序的时候默认寻找的路径。环境变量可以分为永久变量和临时变量,或是用户变量和系统变量。在多人使用同一服务器时,作为非root用户,一般不能直接修改.bashrc(会影响所有用户)。可以在自己目录下单独添加环境配置文件,如编写以下内容:export PYTHONPATH=/home/usr/c...

2018-08-16 20:21:45 10155

原创 Caffe模型调试中的错误总结

错误:Cannot copy param 0 weights from layer '...'; shape mismatch即model和prototxt定义的模型不一样。通常是fine-tune时图片尺寸有了调整,或者改了网络结构想要train时去掉weight参数即可。 错误:Check failed: error == cudaSuccess (2 vs. 0) out of ...

2018-08-16 13:11:50 1562

原创 Caffe编译问题总结

之前因为要修改caffe源码,经常需要重新编译caffe,这里对遇到的问题做一个总结。编译中出现红色的error错误:unsupported GNU version! gcc versions later than 4.9 are not supported! 解决方法:按要求安装一个低版本的gcc,然后在makefile.config重新制定gcc路径为刚刚安装的路径(网上也有人直接修改...

2018-08-16 11:37:49 598

原创 Windows/Linux/Mac OS多窗口/标签常用快捷键

Windows:1、切换窗口:Alt+Tab2、Chrome下切换标签快捷键:ctrl + 1-9 切换1-9个标签页ctrl + tab 下一个标签页ctrl + shift + tab 上一个标签页ctrl + pageup/pagedown 上/下一个标签页Mac OS:1、切换窗口:Command+Tab2、Chrome下切换标签快捷键:C...

2018-08-08 13:49:32 6567

原创 Python+Opencv对视频流进行手势估计——基于caffe

项目中想要看看视频处理的效果,所以基于原来的处理单张RGB图像的程序,参考网上的例子,写了这样一个脚本。一、编写视频处理框架首先载入需要的包,然后设置从参数读入视频路径。# 导入所需软件包import argparseimport datetimeimport imutilsimport timeimport cv2 # 创建参数解析器并解析参数ap = argpar...

2018-08-03 20:41:37 950

原创 Linux常用命令及bash脚本

一、文件管理相关· ls -l,在文件夹大小一列中可能会看到4096,是文件夹目录文件占用的空间· 查看文件夹大小:du -sh 文件夹名· 查看隐藏文件:ls -a 以"."开头的都是隐藏文件· 压缩.tar.gz:tar zcvf file.tar.gz DirAndName 解压.tar.gz:tar -xvzf file.tar.gz· 复制文件夹,文件...

2018-08-01 17:41:24 292

原创 Matlab语法基础与函数笔记

1、i=1:1:9 生成一个向量i,其值分别是1,2,3....9。i=a:step:b语句表示的就是以a为起始点,b为终点,step为步长,生成一个向量。如:v=10:-1:1就生产一个10,9,8,7...1的向量。2、a(:,:,1) 三维矩阵,取a矩阵第一页(z=1)的所有行和列。3、size(A) 返回矩阵每一维的大小 size(A,n) 用1...

2018-07-30 14:56:23 342

原创 MS COCO数据集标注格式解析

COCO是微软提供的一个图像识别的数据集。其中包括3个tasks,分别是object instances, object keypoints, 和image captions,存储格式为JSON。基本的数据结构定义如下:{"info" : info, "images" : [image], "annotations" : [annotation], "licenses" : [lice...

2018-07-30 13:09:42 5901 2

原创 JSON简介及用法

JSON(JavaScript Object Notation, JS 对象简谱) 是一种轻量级的数据交换格式,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言,不仅易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。在JSON中,大括号中保存对象,对象表示为键值对。数据由逗号分隔。数组由中括号保存。例. 用JS...

2018-07-27 20:07:54 695

转载 Python读写LMDB文件

LMDB的全称是Lightning Memory-Mapped Database,它的文件结构简单,包含一个数据文件和一个锁文件。LMDB文件可以同时由多个进程打开,具有极高的数据存取速度,访问简单,不需要运行单独的数据库管理进程,只要在访问数据的代码里引用LMDB库,访问时给文件路径即可。让系统访问大量小文件的开销很大,而LMDB使用内存映射的方式访问文件,使得文件内寻址的开销非常小,使...

2018-07-27 15:33:39 2889 1

转载 Python中的.pkl文件

pkl文件是python里面保存文件的一种格式,如果直接打开会显示一堆序列化的东西。正确的操作方式是使用Pickle模块。Pickle模块将任意一个Python对象转换成一系统字节,这个操作过程叫做串行化对象。打开方式:import cPickle as picklef = open('path')info = pickle.load(f)print info #show f...

2018-07-27 11:16:39 20841 3

原创 Numpy数组学习笔记

1、X[:,0]是numpy中数组的一种写法,表示对一个二维数组,取该二维数组第一维中的所有数据,第二维中取第0个数据,直观来说,X[:,0]就是取所有行的第0个数据, X[:,1] 就是取所有行的第1个数据。2、二维数组索引访问的例子:# 产生1-9的数In [28]: arr2d = np.arange(1,10).reshape((3,3))In [29]: arr2dOut...

2018-07-23 19:36:07 259

原创 Opencv学习笔记

1、矩阵翻转,cv::flip(InputArray src, OutputArray dst, int flipCode)参数:src,输入矩阵dst,翻转后矩阵,类型与src一致flipCode,翻转模式,flipCode==0垂直翻转(沿X轴翻转),flipCode&gt;0水平翻转(沿Y轴翻转),flipCode&lt;0水平垂直翻转(先沿X轴翻转,再沿Y轴翻转,等价于旋转18...

2018-07-23 19:29:32 334

原创 Caffe入门介绍及学习笔记

一、Caffe基础1、Caffe主要依赖项CUDA(Compute Unified Device Architecture),是英伟达公司推出的一种基于新的并行编程模型和指令集架构的通用计算架构,它能利用英伟达GPU的并行计算引擎,比CPU更高效的解决许多复杂计算任务。 NVIDIA cuDNN是用于深度神经网络的GPU加速库。它强调性能、易用性和低内存开销。 Opencv. (Lin...

2018-07-20 19:40:48 429

原创 机器学习&图像处理基本概念笔记整理

Regression: 回归。连续地输出为某些值。Classification: 分类。离散地输出为某些值中的一个。注:Logistic Regression是一种分类的方法,服从二项分布。Regularization: 正则化。减小特征变量数量级,用以防止过拟合。By 加惩罚项Normalization: 归一化(规范化)。统一量纲,加快收敛性。By softmax函数G...

2018-07-13 20:25:31 495

原创 人体姿态估计(Human Pose Estimation)文献综述

一、研究背景维基百科对人体姿态估计的定义如下:Articulated body pose estimation in computer vision is the study of algorithms and systems that recover the pose of an articulated body, which consists of joints and rigid p...

2018-07-13 20:12:57 34978 5

转载 C# Dictionary用法举例

Dictionary常用用法:以 key 的类型为 int , value的类型为string 为例1、创建及初始化Dictionary<int,string>myDictionary=newDictionary<int,string>();2、添加元素myDictionary.Add(1,"C#");myDictionary.Add(2,"C++"...

2018-07-11 21:11:13 472

转载 网络编程及Socket套接字基础

网络编程    网络编程的目的就是指直接或间接地通过网络协议与其他计算机进行通讯。网络编程中 有两个主要的问题,一个是如何准确的定位网络上一台或多台主机,另一个就是找到主机后 如何可靠高效的进行数据传输。在TCP/IP协议中IP层主要负责网络主机的定位,数据传输的 路由,由IP地址可以唯一地确定Internet上的一台主机。而TCP层则提供面向应用的可靠的 或非可靠的数据传输机制,这是网络编程的主...

2018-07-08 22:44:29 218

原创 VS2015 常用组合快捷键

多行注释: CTRL+K,CTRL+C取消注释: CTRL+K,CTRL+U折叠方法:Ctrl + M , Ctrl + O展开方法:Ctrl + M ,   Ctrl +  L注释:        先CTRL+K,然后CTRL+C取消注释: 先CTRL+K,然后CTRL+U...

2018-07-08 14:15:56 967

转载 MySQL修改主键

数据库操作中有时需要将一个主键修改为联合主键或者把主键改为其他列,这时候单纯的add primary key是没有用的,必须先删除主键约束,再重新添加。 1、alter table TABNAME drop primary key;2、alter table TABNAME add primary key(another_col,...); ...

2018-07-05 21:34:39 6837

原创 C#运用List动态添加元素

C#中的数组是不支持动态添加元素的,只能创建固定大小的数组。解决方法:可以使用ListList<string> result = new List<string>();for (int i = 0; i < 5; i++ ){ result.Add(i.ToString());}之后也可以转为数组类型: string[] strArr...

2018-07-04 18:19:26 11357

转载 C#中的typeof()及gettype()

用于获取类型的System.Type对象。typeof表达式采用以下形式:System.Type type = typeof(int);备注:若要获取表达式的运行时类型,可以使用 .NET Framework 方法GetType,如下所示:int i = 0;System.Type type = i.GetType();...

2018-07-04 16:36:53 545

原创 c#连接MySQL数据库与简单操作

首先进行数据库的连接。//server数据库地址,user数据库用户名,password密码,database数据库名string ConnectString = string.Format("Server={0};User ID={1};Password={2};Database={3};", server, user, password, database);MySqlConnect...

2018-07-04 14:29:14 395

Breaker 一款护眼软件

一款护眼软件,可以设置时间定期休息,保护您的视力。

2018-08-07

caffe网络模型各层详解 中文版

一 . 数据层及参数 二.视觉层Vision Layers及参数 等等章节,详细讲解caffe

2018-08-03

Caffe官方教程中译本 高清 非扫描

Caffe官方教程中译本 高清版 非扫描 讲解清楚,阅读方便。官方教程

2018-08-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除