![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
姿态估计逐步
文章平均质量分 82
业精于勤荒于嬉-行成于思而毁于随
希望自己能走的更远更远,踏踏实实,勿忘初心。
展开
-
用我雯示意,图像的加载、读取、转换、热图。 OpenCV彩色转为灰度图、通道拆分(cv2.split)及合并(cv2.merge)
图像加载问题使用pytorch制作图像数据集时,需要将存储在磁盘、硬盘的图像读取到内存中,涉及到图像I/O问题。在python中,图像处理主要采用的库:skimage, opencv-python, Pillow (PIL)。 这三个库均提供了图像读取的方法。三种主流图像处理库的比较:库 函数/方法 返回值 图像像素格式 像素值范围 图像矩阵表示 ...原创 2019-07-10 14:11:19 · 1140 阅读 · 0 评论 -
全局平均池
全连接层上的全局平均池的一个优点是,通过强制特征映射和类别之间的对应,它对卷积结构更加本地化。因此,特征图可以容易地解释为类别置信度图。另一个优点是在全局平均池中没有优化参数,因此在该层避免过度拟合。没什么好处,只是比fc参数少。cv里面不如一直卷积,nlp里面不如用rnn最新的网络中通常都是最后一个全局平均池化加一个全连接至于原因,一是主流模型采用此种方法确实提升了精度(当然不仅这个改...原创 2019-04-19 23:25:17 · 757 阅读 · 0 评论 -
pytorch指定层冻结。初始化权重
PyTorch的Module.modules()和Module.children()在PyTorch中,所有的neural network module都是class torch.nn.Module的子类,在Modules中可以包含其它的Modules,以一种树状结构进行嵌套。当需要返回神经网络中的各个模块时,Module.modules()方法返回网络中所有模块的一个iterator,而...转载 2019-04-28 19:53:37 · 9391 阅读 · 3 评论 -
颜色空间
在人脸检测中也常常用到YCrCb空间,因为一般的图像都是基于RGB空间的,在RGB空间里人脸的肤色受亮度影响相当大,所以肤色点很难从非肤色点中分离出来,也就是说在此空间经过处理后,肤色点是离散的点,中间嵌有很多非肤色,这为肤色区域标定(人脸标定、眼睛等)带来了难题。如果把RGB转为YCrCb空间的话,可以忽略Y(亮度)的影响,因为该空间受亮度影响很小,肤色会产生很好的类聚。这样就把三维的空间降为二...原创 2019-03-28 14:47:44 · 100 阅读 · 0 评论 -
R_50_FPN的module和各层维度
(backbone): Sequential( (body): ResNet( (stem): StemWithFixedBatchNorm( (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False) (bn1): FrozenBat...原创 2019-03-29 09:54:33 · 731 阅读 · 2 评论 -
Resnet代码实现+为什么使用全局平均池化
1.ResNet直接使用stride=2的卷积做下采样,并且用global average pool层替换了全连接层。GAP的真正意义是:对整个网路在结构上做正则化防止过拟合。但是值得我们注意的是,使用gap可能会造成收敛速度减慢。用一个GAP将N个feature map降维成1*N大小的feature map,再用class个1*1卷积核将1*N的feature map卷成1*class的向...原创 2019-04-11 14:32:43 · 4782 阅读 · 1 评论 -
这个要看呀!!!!:中间层提取特征的可视化,以及热图的可视化
https://www.jianshu.com/p/4cca168cff62原创 2019-04-11 11:52:02 · 3254 阅读 · 9 评论 -
maskrcnn_benchmark理解记录——关于batch norm、relu、dropout 的相对顺序以及dropout可不可用
ps:1.如何在卷积神经网络中实现全局平均池化。在此之前,建议阅读ResNet这篇论文,以了解全局平均池化操作的好处。代替全连接层。2.dropout只可能在box分支的两个全连接层那里,这个可以后期finetuning下。全连接网络可以使feature map的维度减少,进而输入到softmax,但是又会造成过拟合,可以用pooling来代替全连接。那就解决了之前的问题:要不要在f...原创 2019-04-11 12:39:55 · 3576 阅读 · 1 评论 -
conda并且从源码安装caffe2,Detectron
碎碎念.......哇!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!我终于安装成功了caffe2.Segmentation fault (core dumped)这个问题了,翻遍全网啊什么bing\google\github.都没用啊.还有我出现的奇奇怪怪的问题,几乎都是靠我自己解决了.我真是个厉害\坚持\漂亮\顽强\善良....集所有优点于一身的的女人!!!!!!...原创 2019-03-28 14:42:54 · 2892 阅读 · 2 评论 -
maskrcnn_benchmark-----Step-by-step tutorial 如何训练自己的数据集以及网络的finetune
https://github.com/facebookresearch/maskrcnn-benchmark/issues/521ps:如果只需要fintune的话,直接看第二部分,是可以查看model的各个键值的,然后根据需要进行删减。ps:后面有个乱七八糟的,是我记录的,后期删改ps:还有个是可以冻结残差网络的训练层的,eg:resnet50,我冻结了最大层,也就是:FREEZE_...翻译 2019-04-25 20:13:30 · 2426 阅读 · 6 评论 -
FCN
后记:传统方法使用patchwise training,为了对像素进行分类,对该像素周围的一个图像块作为CNN的输入,这样做有几个问题:(1)存储开销大;(2)计算效率低下,因为相邻像素块的内容基本重复;(3)像素块的大小限制了感知区域的大小。还有个问题,loss怎么计算?损失函数是在最后一层的spatial map上的每一个pixel的loss和,在每一个pixel使用softm...原创 2019-07-09 17:17:24 · 711 阅读 · 0 评论 -
语义分割、实例分割和全景分割的区别
之前看过一篇使用分割思想进行目标检测,所以这里补习下一些分割相关的基础知识。这里重点说下语义分割、实力分割和全景分割的区别。1 、semantic segmentation(语义分割)通常意义上的目标分割指的就是语义分割,图像语义分割,简而言之就是对一张图片上的所有像素点进行分类语义分割(下图左)就是需要区分到图中每一点像素点,而不仅仅是矩形框框住了。但是同一物体的不同实例不需要单独分...转载 2020-09-30 10:53:29 · 648 阅读 · 0 评论 -
Faster RCNN中RPN理解(需要训练得到粗略proposals的)、附画图代码。biu~
fast+rpn=faster rcnn之前已经用过RPN,因为重心一直在修改我自己的网络结构上,这次重新涉及到此部分的优化重新审视了一下RPN,记录一下。如果把RPN看作一个黑盒子的话,最关心的问题是,输入和输出。RPN输入的是一张图片,输出输出一系列的矩形object proposals。RPN其实就像个“内嵌的”的网络似的,这也正是“两阶段物体检测”的体现之处,进行了初步、首阶段...原创 2020-09-30 10:51:41 · 2311 阅读 · 4 评论 -
pytorch-CPN代码遇到的问题
1.image = scipy.misc.imread(img_path, mode='RGB')AttributeError: 'module' object has no attribute 'imread'原因:SciPy 1.2.0之后已经删除了,用imageio.imread代替解决办法:1.先检查scipy有没有安装好,因为还有其他地方用到 import ...原创 2019-06-20 14:50:17 · 1561 阅读 · 3 评论 -
对FCN的改进,关于dilaition和DUC
Understanding Convolution for Semantic Segmentationhttp://www.cnblogs.com/xiangs/p/9780895.htmlhttps://blog.csdn.net/qq_21997625/arhttps://mp.csdn.net/postedithttps://www.zhihu.com/question/54...原创 2019-07-10 09:24:34 · 1160 阅读 · 0 评论 -
图像处理与计算机视觉的论文创新点总结
https://blog.csdn.net/zhouzhaoxiong1227/article/details/6891966原文:https://blog.csdn.net/lanchunhui/article/details/52763925 创新点的一般方向: ⇒ Generalized:泛化 fixed ⇒ Adaptive,自适应(自调节)...转载 2020-09-30 10:57:22 · 500 阅读 · 0 评论 -
动作识别论文
https://github.com/XiaoCode-er/Skeleton-Based-Action-Recognition-Papers原创 2020-09-30 10:57:39 · 202 阅读 · 0 评论 -
从Inception v1,v2,v3,v4,RexNeXt到Xception再到MobileNets,ShuffleNet,MobileNetV2
分类任务精度:ShuffleNet v2 ≥MobileNet v2 > ShuffeNet v1 > Xception检测任务精度:ShuffleNet v2 > Xception ≥ ShuffleNet v1 ≥ MobileNet v2ps:1.输入网络大小,比如增加网络宽度,网络输入从224*224变为了299*299。也就是特征图也变大了,网络"变...转载 2019-05-15 21:30:06 · 681 阅读 · 0 评论 -
六种人体姿态估计的深度学习模型和代码总结
六种人体姿态估计的深度学习模型和代码总结姿态估计的目标是在RGB图像或视频中描绘出人体的形状,这是一种多方面任务,其中包含了目标检测、姿态估计、分割等等。有些需要在非水平表面进行定位的应用可能也会用到姿态估计,例如图形、增强现实或者人机交互。姿态估计同样包含许多基于3D物体的辨认。在这篇文章中,Model Zoo的作者汇总了几种开源的深度学习模型以及针对姿态估计的代码,论智对其进行了编译,...转载 2018-08-24 17:09:56 · 30931 阅读 · 4 评论 -
ubuntu下alphapose 需要的配置小记
2019.1.21更新。不需要安装太多依赖库pip install -r requirements.txt 即可。其中有(但我的torch安装不上)torch==0.4.0torchvisionvisdomnibabelpandastqdmmatplotlibopencv-pythonntpath有些安装ntpath出问题,这是用于视频演示的,而且不是必要项。作者回应...原创 2019-03-04 22:28:37 · 6966 阅读 · 17 评论 -
【论文复现】VGG框架讲解以及VGG16复现,迁移学习自己的数据。tensorflow。
论文链接,至于论文我没仔细看,我只学习了其框架。但是需要注意的是:在训练期间,ConvNets的输入是固定大小的224×224 RGB图像。 唯一预处理是从每个像素中减去在训练集上计算的平均RGB值,(eg:VGG16是:VGG_MEAN = tf.constant([123.68, 116.779, 103.939], dtype=tf.float32))处理时候转换成了RGB→BGR格...原创 2018-10-23 19:33:30 · 2682 阅读 · 0 评论 -
『算法学习』CPN:Cascaded Pyramid Network for Multi-Person Pose Estimation
原文L:https://www.cnblogs.com/hellcat/p/10138036.html论文连接CVPR2018的文章,用于关键点检测(原话叫“多人姿态估计”)。本算发聚焦点在于处理多人姿态估计所面临的挑战:关键点遮挡,关键点不可见,复杂背景等——就是优化对于难以检测的点的预测,即着重于处理 “hard” 关键点。思路就是detector先定位bbox,然后使用CPN检测...转载 2018-12-19 15:50:30 · 474 阅读 · 0 评论 -
Mask RCNN 学习笔记+网络+ROI Align+ResNet
https://blog.csdn.net/jningwei/article/details/80429768Mask RCNN 学习笔记,网络之类https://www.cnblogs.com/wangyong/p/9305347.html令人拍案称奇的Mask RCNN+ROI Align(ROI Align难懂)https://zhuanlan.zhihu.com/p/3799871...原创 2019-03-28 14:43:42 · 525 阅读 · 0 评论 -
Ubuntu14.04配置Detectron,及问题.
安装依赖(txt文件有的就不用了)opencv-python>=3.2 future源码编译:make && make ops编译了一天:PROJECT_SOURCE_DIR为包含PROJECT()的最近一个CMakeLists.txt文件所在的文件夹。cmake问题 要学着去分析CMakeLists.txt.内容出现问题1:CMake Error at cm...原创 2018-11-29 15:25:54 · 1436 阅读 · 4 评论 -
关于论文 姿态估计和追踪的衡量基准 official evaluation metric
1.on PoseTrack Challenge dataset.“*” means models trained on train+validation set. Top: Results on PoseTrack valida-tion set. Bottom: Results on PoseTrack test setAblation study:With Joint Similar...原创 2018-11-17 23:31:21 · 258 阅读 · 0 评论 -
Ubuntu,配置DetectAndTrack。
Table of Contents一、项目地址二、要求三、安装四、数据集与评价**注意**:五、运行六、已知问题:ubuntu 上的问题分享:一、项目地址[github] [project page]、[paper]:Girdhar R, Gkioxari G, Torresani L, et al. Detect-and-Track: Effi...原创 2019-03-28 12:47:36 · 1239 阅读 · 7 评论 -
OpenPose 配置小记
目前视觉监控和识别的应用越来越流行,在安保、交通、娱乐领域对人体骨架的提取,是很多行为识别、体感交互的基础。这一技术,应该是在深度网络成功应用之后,在MSCOCO大量数据上,获得了很好的提升,目前应该已经达到成熟商用的阶段。视觉应用,有很多的开源代码,国际前沿的研究者总是迫不及待的发表论文和发布代码,争先获得同行认可,扩大自己的影响力,企业则抢占技术领先优势,培育自己的技术生态环境。因此现...原创 2018-09-05 11:48:12 · 1423 阅读 · 0 评论 -
今天算是我的第一个10.24程序员节吧,记录由VGG16复现过程中初见的用法、函数等,以此起步。
1.a[len(a):len(a)]=[]a=[]a[len(a):len(a)]=[]可以用来扩展list,类似append,但是append,又类似于”整体加入“a=[8,9] print(a) a[len(a):len(a)]=[1,2,3] print(a,) a.append([7,7]) print(a) a.append('b') print(a) a...原创 2018-10-24 14:25:12 · 231 阅读 · 0 评论 -
Faster RCNN pytorch编译问题
1.要先编译faster rcnn错误1:error: no commands supplied~/HelloWorld/RCNN/faster_rcnn_pytorch-master/faster_rcnn$ python setup.pyusage: setup.py [global_opts] cmd1 [cmd1_opts] [cmd2 [cmd2_opts] ...] ...原创 2018-11-09 10:25:41 · 1434 阅读 · 0 评论 -
小白逐步。Windows7+python3.6+64.安装pip以及numpy
安装numpy是非常必要的,而安装numpy有需要确认是否安装pip,特此汇总。一般python3.X之后都是有pip的,但奇怪我的没有,故重新补充安装,搜的资料都没有很详细的,这里详细说一下。1.是否有pip。1.在cmd命令中输入:pip --version 若提示不存在,则可能是未将pip的路径存到环境变量中,或者未安装。此时可查看安装地址, 一般在Scripts文件夹内,如我...原创 2018-07-17 17:38:42 · 1509 阅读 · 0 评论 -
detectron+caffe2+maskrcnn汇总
MaskrcnnBenchmark 源码解析-模型定义(modeling)之骨架网络(backbone)maskrcnn_benchmark代码分析(1)拆解 MaskRCNN-Benchmark 项目地址:1.tensorflow+keras 2.Detectron3.MODEL_ZOODetectronDetectron 总结(一)Detectron 总结(二...原创 2018-12-14 14:24:49 · 345 阅读 · 0 评论 -
DETECTRON Mask_RCNN训练及使用
这个还可以关联pascal voc等等,但pascal voc主要是分割等,关键点的话就coco,posetrackCOCO数据集下载:https://blog.csdn.net/u014734886/article/details/78830713Setting Up DatasetsThis directory contains symlinks to data locatio...原创 2018-12-11 22:12:03 · 1287 阅读 · 0 评论 -
关于追踪
作者:求是链接:https://www.zhihu.com/question/26493945/answer/269900232来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。https://note.youdao.com/ynoteshare1/index.html?id=e8b09b17964bfac51b6e2161ebeb759d&type=no...转载 2019-01-20 14:36:35 · 264 阅读 · 0 评论 -
打分标准——mask和keypoint
box打分常用IoU等1.大多数把分类的置信度被当作mask的质量衡量指标2.Mask Scoring R-CNN:3. keypoints又有不同https://www.jianshu.com/p/ad4baa95f92chttps://blog.csdn.net/u014734886/article/details/78837961https://www.cn...原创 2019-03-22 22:01:22 · 445 阅读 · 1 评论 -
人体姿态估计数据集整理(Pose Estimation/Keypoint):MSCOCO(逐年)、LSP、FLIC、MPII、AI Challenge及打分标准
姿态估计等数据集收集整理;LSP: 样本数:2K 关节点个数:14 全身,单人Leeds Sports Dataset [12]及其扩展[13],我们将通过LSP共同表示。它们包含11000个训练和1000个测试图像。这些是来自体育活动的图像,因此在外观和特别是关节方面非常具有挑战性。FLIC 样本数:2W. 关节点个数:9 全身,...原创 2020-09-30 10:55:02 · 16665 阅读 · 10 评论 -
FC
作者:魏秀参链接:https://www.zhihu.com/question/41037974/answer/150522307来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。全连接层到底什么用?我来谈三点。全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作...转载 2019-03-19 12:30:13 · 192 阅读 · 0 评论 -
优化算法记录
参考:https://blog.csdn.net/wishchin/article/details/80567558https://zhuanlan.zhihu.com/p/322625401.改进Adam的方法:前期用Adam,享受Adam快速收敛的优势;后期切换到SGD,慢慢寻找最优解。这一方法以前也被研究者们用到,不过主要是根据经验来选择切换的时机和切换后的学习率。Adam+SGD...转载 2019-03-22 13:58:42 · 234 阅读 · 2 评论 -
maskrcnn-benchmark理解记录——R_50_FPN的module和各层维度
Table of Contents序、一些记录一、先看GeneralizedRCNNA、backbone1)ResNet2)FPN #todoB、rpn1)anchor_generator:2)head #todo3)box_selector_train(inference.py)#todo4)box_selector_testC、rois_h...原创 2019-03-18 17:23:17 · 2750 阅读 · 6 评论 -
stn pytorch
# -*- coding: utf-8 -*-"""Spatial Transformer Networks Tutorial=====================================**Author**: `Ghassen HAMROUNI <https://github.com/GHamrouni>`_.. figure:: /_static/img/...转载 2019-03-05 17:08:58 · 917 阅读 · 0 评论 -
图像分割中CNN的简史:从R-CNN到Mask R-CNN
图像分割中CNN的简史:从R-CNN到MaskR-CNN比较好的说目标检测一直到mask rcnn博客:https://blog.csdn.net/horizonheart/article/details/81188161#commentBox的网络图https://blog.csdn.net/hnshahao/article/details/81231211https:/...转载 2020-09-30 10:52:16 · 575 阅读 · 0 评论