自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 资源 (3)
  • 收藏
  • 关注

原创 caffe安装配置

caffe安装配置1. 不管是打算安装caffe还是仅仅安装专业的显卡驱动,最首先做的是安装显卡驱动。没错,先不要管什么cuda,cudnn,opencv等等,先安装专业显卡驱动。明确了这个顺序,就不怕网上找到的教程是江湖郎中一样不可靠了。基本流程特别重要,一定按照这个流程来做,具体做法参考引用博客里面的说明。显卡驱动和cuda以及cudnn(需要参考其他blog)安装显卡驱动需要一系列的操作,不如

2017-11-27 18:49:20 482

原创 姿态检查整理--07-RMPE: Regional Multi-Person Pose Estimation

RMPE: Regional Multi-Person Pose Estimation多人姿态估计top-down方法,多人情况下小的定位与识别的错误难以避免,这篇文章提出的方法是regional multiperson pose estimation(RMPE),包括三个部分: Symmetric Spatial Transformer Network (SSTN), Parametric Pos

2017-11-27 15:39:08 4906 1

原创 姿态检测整理--06-Associative Embedding: End-to-End Learning for Joint Detection and Grouping

Associative Embedding: End-to-End Learning for Joint Detection and Grouping(发表于2017年6月)是bottom-up方法。这篇文章提出的方法是同时输出检测目标和分组,所以是一站式的方法,而且还用在了两个小领域:多人姿态检查,目标分割。这篇论文读起来非常难懂,不是因为晦涩,而是因为作者定位太高。以后写论文,创新点就是要当作创

2017-11-27 15:27:57 7197

原创 姿态检测整理--01-Stacked Hourglass Networks for Human Pose Estimation

Stacked Hourglass Networks for Human Pose Estimation(发表于2016年)基本上是目前姿态研究的基础网络,具有bottom-up和top-down二者特性。bottom-up是先得到肢体再归并到不同个体。姿态检测的history:人们开始从传统方法[2-9]转而研究深度神经网络在这方面的应用,是Toshev[24]成功应用神经网络估计人类姿态,他使用

2017-11-27 15:14:11 4124

原创 姿态论文整理--05-Learning feature pyramids for human pose estimation

Learning feature pyramids for human pose estimation(2017年发表)如果说有人注意到了pose estimation中没人做过形态的扭曲而写了一篇global & local noramlization,从而将人体形态调整到一个固定的方位。那么这篇文章就是注意到了没人在pose estimation中做过目标对象的缩放而做了一个肢体因而做了这篇论文

2017-11-25 20:55:26 2959 1

原创 姿态论文整理--04-Human pose estimation using global and local normalization

Human pose estimation using global and local normalization(中科大的论文)也是bottom-up,人体姿态估计分为两大部分,关节检测,关节的空间位置匹配。这篇论文主要将精力放到后者上面。对此提出了两阶段的归一化(感觉在这篇文章里面称为标准化更好),躯干的标准化,肢体的标准化。这篇文章的目的是想提出类似与PCA normalization(wh

2017-11-25 20:11:55 1007

原创 姿态论文整理--03-Multi-Context Attention for human pose estimation

Multi-Context Attention for human pose estimation(发表与2017年2月)这篇论文的关键点是构建多尺度下的CNN,研究尺度的变化是此论文的创新的地方,所得到的网络是端到端的框架结构。整体方法:首先使用stacked Hourglass堆叠沙漏网络的的attention map 热点图。然后使用CRF(conditional random field)得

2017-11-25 17:46:42 2465 2

原创 姿态论文整理--02-Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields(发表于2017年4月14)可以对多人场景的人体姿态进行识别,得到2D火柴棒。这篇论文是bottom-up(先检测肢干[keypoints or parts],再归类为不同个体)方法。其中构建肢干间联系是这篇文章的重点。许多方法都是单人姿态估计,这篇是处理多人场景,所

2017-11-25 16:55:24 1347

原创 神经网络--姿态识别论文综述备忘录

关于姿态的论文下载及意义的有关说明(2017年11月23日):链接1–(较为概括但简略)首先是知乎有一个2017年姿态方面的论文/相关工作的一个总结。所以直接照搬过来,一个比较高屋建瓴的综述性的文章。https://zhuanlan.zhihu.com/p/27293180 《VALSE2017系列之三:人体姿态识别领域年度进展报告》[1]。这篇综述性质的科普问所幸被收录在一个该领域的以为研究博士的

2017-11-21 21:58:10 5373 3

原创 numpy缩放图片/调整图片大小

遇到numpy需要调整大小的情况,暂时没找到好方法,所以调用了PIL库,但是,我处理的矩阵格式是float类型。很是麻烦,写了一个转换代码,用到了3个函数def transfer(image): """ data is transfered to 0-255,将矩阵转成uint8型,并保留转换回来的范围。这儿使用的是线性变换。 transfer() & re_transfer

2017-11-21 21:47:26 28182 2

原创 opencv分水岭算法的两个新用法

opencv中的分水岭算法非常高效,在一些场景中存在价值很高,可以由创意的调用这个程序,减少重写代码的量。但最近遇到的问题让我发现想用好它不是很简单。今天提到的两个方法,当一个由创造性的调包侠吧。一、用分水岭算法得到斑块的中轴线 上图是斑块,下图是各斑块的分界线上代码:void onWatershed(Mat im)//分水岭,im已被处理成单通道参考(通过split()){ Mat

2017-11-17 23:25:55 720

原创 SSD的源码解读——MultiBoxLoss函数定义

SSD如何计算location loss functionSSD在计算损失函数的时候,用到了两项的加和,类别的confidence和对default box location的回归分别计算的损失值。 N是匹配的default boxes的个数,x表示匹配了的框是否属于类别p,取值{0,1};l是预测框predicted box,g是真实值ground truth box;c是指所框选目标属于类

2017-11-17 22:48:24 7712

原创 SSD的caffe源码解读 -- 数据增强

SSD 的数据增强对ssd网络识别小物体效果明显(原文Fig6),而且他使用的方法有点特别,所以在此解析一下他的源码。python代码补充一下data augment翻译:叫“数据增广”更好,中科院自动化所的师兄的翻译更准确(一) ssd_pascal.py/examples/ssd/ssd_pascal.py 在此源码中有几个点是涉及到数据预处理的,在此列举如下:#第93行...

2017-11-17 22:26:08 10290 2

原创 数据增强 data augmentation

有人称为数据扩充,不过更多按原意翻译为:数据增强(补充:数据增广更准确)数据增强的方法种类一些常见方法,如裁剪/缩放/彩色变换/翻转等,可参考:https://www.cnblogs.com/zhonghuasong/p/7256498.html ,海康威视也有一些数据增强的处理文档,对“裁剪”这种方法的使用更积极一些:https://zhuanlan.zhihu.com/p/232490...

2017-11-14 22:19:27 28206

原创 python在回调函数中获取返回值

python中有用到回调函数的时候,而回调函数又需要返回数值的时候,就需要先将所被传为回调函数的函数先赋值给一个变量,然后等回调结束之后,将这个变量取值回来就可以了。如我用到到的调用xmlreader时,传入的一个函数需要取回返回值的代码: # 创建一个 XMLReader parser = xml.sax.make_parser() # turn off namep

2017-11-13 09:58:06 6377 1

原创 Window使用问题积累

ipv4设置出错导致的问题究极解决方法最近(2017年11月)遇到一个问题,ipv4设置出错了,重复网络。在网上搜了些资料没能解决,通过不懈努力,找了一个重装的办法:netsh interface ipv4 install

2017-11-12 20:21:43 147

原创 如何确定像素类型以得到像素值

opencv中的Mat数组类型用起来非常方便,但是我经常用到的两种由坐标获取像素灰度值的方式为Mat img;img.at(i,j)//或者指针方式img.ptr(I,j)都需要指定具体的类型。于此相关的更多细节可以参考这篇文章:【OpenCV】访问Mat中每个像素的值(新)http://blog.csdn.net/xiaowei_cqu/article/details/19

2017-11-04 20:28:37 2443

MarekKowalski/DeepAlignmentNetwork模型参数1

MarekKowalski/DeepAlignmentNetwork所需要的网络参数模型,原下载链接再此:https://www.dropbox.com/sh/v754z1egib0hamh/AADGX1SE9GCj4h3eDazsc0bXa?dl=0

2018-07-18

Dynamic Network Surgery for Efficient DNNs的makefile.config文件

Dynamic Network Surgery for Efficient DNNs是简化版的caffe,结果就是编译时有些与众不同,配合另外一个资源makefile,一块完成该资源的编译

2018-06-12

Dynamic Network Surgery for Efficient DNNs的makefile文件

Dynamic Network Surgery for Efficient DNNs是使用了简化了的caffe,其中python,matlab,experiment等都去掉了,拿过来用的时候编译时反而有点不知所错,这个的修改好的makefile,可直接拿去编译

2018-06-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除