深度学习
Jie Ou
学习
展开
-
Pytorch 在训练NLP相关模型中的一些BUG
1、RuntimeError: Expected `len(lengths)` to be equal to batch_size, but got 9 (batch_size=18)这个问题,有很多人讨论。主要是涉及到使用nn.DataParallel 利用多GPU训练RNN模型会碰到这个问题,主要是因为输入RNN的之前数据为 b,c,h;但是输入的时候会利用permute(1, 0)变成c,b,h;这个时候DataParallel会把数据变成c//2,b,h;此时问题就出现了,tor.原创 2020-06-03 15:41:05 · 2387 阅读 · 2 评论 -
【文章解读】FreeAnchor: Learning to Match Anchors for Visual Object Detection
一、简介 这些年已经有不少基于深度学习的目标检测的文章了,从最开始的Anchor based 到后来的 Anchor Free。但是解读这篇文章,主要是由于他的出发点比较新颖---Free Anchor。 虽然叫Free Anchor,但是依然是Anchor based的方法,只不过他打破了一直以来的Anchor分配机制。二、回顾Anchor分配机制 ...原创 2020-04-04 23:31:29 · 1669 阅读 · 0 评论 -
【文章阅读】The Devil is in the Decoder【计算机视觉中的上采样方式-6种】
一、这是google的一篇探索的文章,探讨decoder结构的一篇文章二、主要贡献点 1、 探讨了不同的几种decoder的优劣,提出自己的上采样方案 2、 提出针对上采样的residual connection 3、 横向多任务对比各种不同方案三、不同结构decoder的对比TransposedConvolution:这个也是我们常说的“反卷...原创 2019-11-18 14:22:47 · 608 阅读 · 0 评论 -
pytorch loss 出现nan,原因之一,计算图中存在torch.sqrt或者 **0.5,以及如何解决
今天写一个loss函数dist=torch.sqrt(x*x+y*y)loss=soomthL1loss(dist,gt_dist)我随便写的几句示意代码,这样会导致在第一个iteration之后出现nan,第一次iteration之内,还是可以看到loss不为nan的。解决办法: 1、不开方,因为开方的求导会出现在分母上,因此需要避免分母为0! 2、tor...原创 2019-11-11 15:08:14 · 8270 阅读 · 3 评论 -
【姿态估计文章阅读】PifPaf: Composite Fields for Human Pose Estimation
一、CVPR2019,内容上还是比较厉害的,代码:https://github.com/vita-epfl/openpifpaf二、主要思想 1、提出了Part Intensity Field (PIF)来提升heatmap在高分辨率下的精度 2、利用Part Association Field (PAF)来连接joints 3、本文方法主要...原创 2019-11-05 17:14:30 · 4005 阅读 · 0 评论 -
【姿态估计文章阅读】Single-Stage Multi-Person Pose Machines【依图科技】
一、今年ICCV2019刚出炉的文章,颜水成教授团队的,非官方代码:https://github.com/murdockhou/Single-Stage-Multi-person-Pose-Machines二、这篇文章核心思想 1、点评了下目前多人姿态估计中的现状:大多数人都在多two-stage,很多模型都是但人姿态估计结合上人体检测,这也是这两年的主要内容,效果虽然好,但是缺...原创 2019-11-04 15:07:13 · 3322 阅读 · 3 评论 -
【姿态估计文章阅读】Joint Training of a Convolutional Network and a Graphical Model for Human Pose Estimation
一、这是毫无疑问的大佬们的文章,2014年出就发布了第一版本,代码:https://github.com/max-andr/joint-cnn-mrf二、文章的核心思想 1、利用CNN做姿态估计,采用heatmap的方式来回归出关键点 2、利用人体关键点之间的结构关系,结合马尔科夫随机场的思想来优化预测结果,主要针对于网络预测的false postive。三...原创 2019-11-03 19:53:39 · 4317 阅读 · 3 评论 -
【姿态估计文章阅读】Human Pose Estimation with Iterative Error Feedback【这篇文章看的虽然有点迷糊,但是最后有一点很重要,自适应scale】
一、这是伯克利的大哥哥们在2016年发的一篇文章,也算是CNN的姿态估计,上升比较快的那几年。二、其实核心思想很像GBDT,一步步的去拟合残差。但是,不一样肯定是不一样的!放一张好看的图,GBDT的。 主要贡献: 1、提出一种自我修正的模型 2、传统模型映射是建立在“从in...原创 2019-11-01 18:08:40 · 1128 阅读 · 1 评论 -
【姿态估计文章阅读】Efficient Object Localization Using Convolutional Networks【大佬文,每一个实验都值得一看】
一、这是大佬们的一篇文章,算是比较早的利用CNN预测heatmap来做姿态估计的文章,上传时间2015年。二、这篇文章的核心思想: 1、pooling层能为网络增强一些“局部不变性”、“旋转不变性”之类的能力,也能降低参数等种种优点的同时对于回归heatmap的任务却会带来location的精度损失。因此提出了一种新的结构,用于弥补pooling的负效应,“position r...原创 2019-11-01 16:06:22 · 2239 阅读 · 3 评论 -
【姿态估计文章阅读】Structured Feature Learning for Pose Estimation
一、年份2016、港中文的文章二、代码https://github.com/chuxiaoselena/StructuredFeature用的是caffe,可视化出来的结构比较复杂不好展示,就不放图片了三、核心思想: 利用双向结构的树,优化网络对于结果的预测。也就是预测手肘的时候可以用上手腕和肩膀的信息。文章把这个用信息体现在feature map的使用上,并且采用“...原创 2019-10-31 16:33:16 · 443 阅读 · 0 评论 -
【简单的Pytorch回归模型案例】CNN去除随机噪声--修复2d高斯分布【pytorch demo】
一、这是个Pytorch学习案例,可以根据这个案例写自己的模型二、代码1、导入相关模块import torch from torch import nnimport torchvisionimport numpy as npimport cv2%matplotlib inlineimport matplotlib.pyplot as plt from torch....原创 2019-10-30 15:52:09 · 2133 阅读 · 0 评论 -
【姿态估计论文阅读】Multi-Scale Structure-Aware Network for Human Pose Estimation
前言:这是ECCV2018的文章,也是MPII目前的top 结果。这篇文章,用了很多“中继监督",本文的主要思想是结合“多尺度信息”,把这个体现到loss中,并且对多尺度信息进行结合,利用这一点来提升feature 效果。同时也引入了人体的结构信息,不像以前都是单个keypoint的heatmap 单独预测,本文还预测一种关联heatmap。还提出了一种keypoint的m...原创 2019-01-22 16:48:53 · 1522 阅读 · 1 评论 -
【目标检测】【数据增广】Data Augmentation For Object Detection
这是一个大佬在github 开源的项目,专门针对“目标检测”的“数据增广”!代码地址:https://github.com/Paperspace/DataAugmentationForObjectDetection博客地址:https://blog.paperspace.com/data-augmentation-for-bounding-boxes/如果我这样侵权了,请联系我删除!!...翻译 2019-01-23 16:17:44 · 7019 阅读 · 10 评论 -
CrowdPose: Efficient Crowded Scenes Pose Estimation and A New Benchmark 论文阅读
一、这是Alphapose的最新工作 特点,针对的是 “ crowd”场景下的多人姿态估计。 相对于以往的一些多人姿态估计工作而言,基本上都是不合适应用在“Crowd”场景之下的,比如Mask-RCNN训练的时候,会直接去除数据中的“Crowd”数据(MSCOCO)有这个标签,MPII没有这个标签。 ...原创 2019-03-06 15:57:50 · 1822 阅读 · 0 评论 -
【论文阅读-目标检测】Feature Selective Anchor-Free Module for Single-Shot Object Detection
这篇文章从视觉效果上来说,很大程度的提升了“小目标的”检测效果。一、主要内容这篇文章主要是针对FPN这种结构去做优化的,主要的优化点在于“如何去选择哪一层来回归目标”。以往的方法基本上都是基于“Heuristic feature selection” 以及 “overlap-based anchor sampling”“Heuristic feature s...原创 2019-04-11 15:23:24 · 2605 阅读 · 1 评论 -
【论文阅读】Deeply Learned Compositional Models for Human Pose Estimation 【ECCV2018】
一、本文想要解决的问题 1、提高精度 2、尽量解决因为“遮挡” ,“画面中其他人物关节的干扰”、“杂乱的背景” 导致的错误 二、提出的方案 1、Deeply Learned Compositional Model (DLCM) 2、spatially local information summarizat...原创 2019-04-09 14:26:41 · 2482 阅读 · 0 评论 -
Caffe 手写 python layer ,利用python layer进行debug调试
一、caffe 这个框架就不介绍了,学习deeplearning的人可以不知道tensorflow ,pytorch,但是不能不知道caffe!二、caffe 框架内置了很多的layer,利用 prototxt进行调用及网络结构设计! 每一层,都需要通过设定如下的参数进行调整!看起来会比现在的很多利用python的框架麻烦,现在的很多框架想要实现一层卷积,基本上就是一行代码:...原创 2019-04-29 15:10:03 · 416 阅读 · 1 评论 -
【论文阅读】Deep Residual Learning for Image Recognition 【ResNet】
一、论文来自于凯明大哥的团队,这也是近几年来大多数计算机视觉任务,网络baseline的基础二、核心思想 1、如何个去构建更深层的网络,因为之前的一些工作证明了,网络层次的加深有助于提高模型的性能。但是随着层级的加深,让网络的训练变得更加困难。主要表现在“梯度消失”、“退化问题”。 *针对梯度消失问题:主要会阻碍网络的收敛,这个问题的解决办...原创 2019-06-21 15:39:53 · 464 阅读 · 3 评论 -
【论文阅读】Does Learning Specific Features for Related Parts Help Human Pose Estimation?
一、CVPR2019二、主要思想 目前几乎所有的pose 网络,针对“单人姿态估计网络”,几乎都是共享全部feature 的。这个的意思从代码上来理解就是,在最后一层 1*1的那个卷积层 一次性输出所有需要预测的 joint,他们的输入都是相同的。 这篇文章的作者,这里这样做是不合理的,并不是所有的关键点都是需要共享 high-level representa...原创 2019-06-17 16:33:52 · 1831 阅读 · 8 评论 -
【论文阅读】【AlexNet】【dropout】ImageNet Classification with Deep Convolutional Neural Networks
一、这是AlexNet,虽然是很多年前的网络了,但是在今天依然有着举足轻重的地位!特别是其中的思想,非常关键!二、主要思想 1、采用了非饱和神经元(通过Relu-非饱和非线性函数) 2、多GPU拆分计算 3、在全连接层采用了Dropout来降低overfitting 4、利用了LRN(local response nor...原创 2019-06-25 20:25:22 · 790 阅读 · 0 评论 -
【论问阅读】VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION
一、 这篇文章,论文写的读起来很舒服,实验做的非常细,以前一直没看,看了之后发现,现在用的很多方法,都是人家玩剩下的。二、主要内容 探索更深的网络、探索小卷积核3x3、探索比对训练与测试三、VGG主要架构 基本上我们只知道VGG有两个模型,16层和19层...原创 2019-06-18 14:56:18 · 382 阅读 · 0 评论 -
【CNN感受野计算】python 示例含盖 vgg alexnet rtpose等
一、感受野 layer 1 : kernel size:3*3 stride:1 layer2 :kernel size:3*3 stride:1 第一层的感受野就是卷积核大小 3*3 ,第二层感受野是5*5 这个也比较好理解,对于第一层计算之后的feature map而言,每一个pixel都对应了layer1的input的3*3大小的区域;...原创 2019-06-18 16:26:30 · 703 阅读 · 0 评论 -
环境安装、cuda安装、caffe安装、教学
深度学习服务器配置、cuda安装等服务。个人使用环境配置,50元起,在线指导深度学习实战,针对入门的朋友,50元一次,具体再说。原创 2018-07-12 21:13:57 · 312 阅读 · 0 评论 -
【图像分割综述】 Image Segmentation Review 【代码总汇】code
前言:在目前的应用中,图像分割可以分为以下几大类 1、自动驾驶领域-车道线分割,车道分割,instance分割等 2、普通图像 - 基于类别的图像分割/基于instance的图像分割 3、医学图像 - 2/3D 图像分割,通常是非instance的 图像分割、姿态估计、目标检测 在 卷积神经网络...原创 2019-01-17 11:21:52 · 2378 阅读 · 0 评论 -
【医疗图像分割】Deep neural networks for the detection and segmentation of the retinal fluid in OCT images.
题目:Deep neural networks for the detection and segmentation of the retinal fluid in OCT images. 背景介绍:这依然是一篇MICAI 2017的文章,来自于MICAI2017的workshop挑战赛,Retouch Challenge 2017.关于比赛内容以及比赛结果等信息可以点积这个...原创 2019-01-21 10:36:56 · 924 阅读 · 0 评论 -
如何用基于resnet的Unet进行图像分割 基于Pytorch-0.5版本
1、关于Unet Unet主要用于医学图像的很多论文中,以及Kaggle竞赛和一些其他竞赛中“少类别”的图像分割。从我做实验的经验来说,像VOC这种类别比较多的分割任务,不容易收敛,效果较为差。2、Resnet34 我们的encode部分选择resnet34,decode部分为每一个block制作三层卷积,其中每个的第二层为upsample(bilinear/de...原创 2018-10-22 16:06:34 · 22543 阅读 · 24 评论 -
dataset for semantic sgementation ,图像分割任务中VOC的augment dataset 到底在哪?
一、VOC12_AUG 大多数近期的论文都提到了,自己使用的是“we use augmented data with the annotation of XXX result in 10582 ,1449 and 1456 for training ,validation and testing”也就是“Semantic contours from inverse de...原创 2018-08-06 14:34:57 · 3801 阅读 · 5 评论 -
pytorch 小例子 demo 使用demo
我使用anaconda3,建议大家也用这个,好用!!!假设你安装完了anaconda3.一、创建一个测试Demo的实验环境conda create -n PyTorch-demo python=3.6The following NEW packages will be INSTALLED: ca-certificates: 2018.03.07-0 certi...原创 2018-08-03 21:40:31 · 9626 阅读 · 0 评论 -
pytorch master + anacoda3 + cudnn7+cudnn5+ 虚拟环境
首先说一下cudnn 不同版本是可以并存的, cudnn5系列要求在/usr/local/cuda/lib64 路径下要存在 链接到libcudnn.so.5.1.10 的libcudnn.so cudnn7系列只需要在/usr/local/cuda/lib64 路径下存在 libcudnn.so.7 就可以了,所以不会产生冲突这样就可以完成 多版本cudnn 并存...原创 2018-08-03 16:15:36 · 447 阅读 · 0 评论 -
hourglass pytorch 实现
主要分为几块1、数据集读取2、hg-model3、training翻译 2018-07-13 14:30:50 · 6527 阅读 · 17 评论 -
基于深度学习的图像检索 image retrieval based on deep learning (code ,代码)
本次代码分享主要是用的caffe框架,至于caffe框架的安装过程不再说明。代码修改自“cross weights”的一篇2016年的文章,但是名字忘记了,谁记得,提醒我下。一、环境要求 1、python 2、gcc 3、opencv 4、一些图像数集合,比如holiday、oxford、paris不过这些都是标准数据集,你也可以用到自己的系...转载 2018-06-28 09:23:44 · 6841 阅读 · 11 评论 -
Jointly Optimize Data Augmentation and Network Training: Adversarial Data Augmentation in Human Pose
Jointly Optimize Data Augmentation and Network Training:Adversarial Data Augmentation in Human Pose Estimation论文解读一、简介 这是一篇2018年的CVPR,这篇文章主要创新点在于把传统的数据增广利用 对抗学习的思想结合增强学习 来应用到了姿态估计上。、二、文章内容 文章主要有...原创 2018-07-09 12:54:58 · 1207 阅读 · 0 评论 -
DensePose:Dense Human Pose Estimation In The Wild 论文阅读笔记
一、本文主要是Facebook AI 和INRIA 联合出品,基于RCNN架构,以及Mask RCNN的多任务结构,开源http://densepose.org二、主要工作分为两点1:标注了一个新的数据集,基于coco数据集,增加了uv标注,该数据集开源。2:设计了一个框架可以用于输出uv坐标。三:数据集介绍:标注上了UV坐标之后,可以将一个3D人物的表面经过变换投影到2D图像上,并且会根据2D图...原创 2018-06-26 23:23:03 · 6492 阅读 · 0 评论 -
接深度学习,opencv人脸识别,目标检测等项目
本人接收机器学习,深度学习,opencv的人脸识别,人脸检测,笑脸识别,目标检测,分类等项目!原创 2017-02-26 13:40:21 · 1403 阅读 · 2 评论 -
(翻译,解读)TWO-STAGEPOOLING OF DEEP CONVOLUTIONAL FEATURES FOR IMAGE RETRIEVAL
TWO-STAGEPOOLING OF DEEP CONVOLUTIONAL FEATURES FOR IMAGERETRIEVALTianchengZhi, Ling-Yu Duan, Yitong Wang, Tiejun Huang(这是一篇翻译文章,我自己读了这篇文章,顺便写了点自己的理解,和大家交流下里面的内容)摘要:CNN(卷积神经网络)基于图片表征翻译 2016-12-12 21:04:16 · 544 阅读 · 0 评论 -
【人体姿态追踪】Pose Flow: Efficient Online Pose Tracking 【解读】
工作组:上交卢老师团队发表处:BMVC开源代码:https://github.com/YuliangXiu/PoseFlow参考博客:https://blog.csdn.net/m0_37644085/article/details/83038566,https://blog.csdn.net/zhangjunhit/article/details/79524796特别说明:如...原创 2018-12-13 16:02:36 · 7600 阅读 · 6 评论 -
【文章阅读】【代码复现】BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation 【code】
文章归类:图像分割,网络结构创新,实时主体思想:1、希望利用网络结构的改造,来弥补“感受野”受限的不足,因此BiSeNet的网络结构拥有两条主线“Spatial Path (SP)” 和 “Context Path (CP)” 2、设计了特征整合的新模块“Feature Fusion Module (FFM)” 以及 用于attenti...原创 2018-12-07 10:06:09 · 3096 阅读 · 2 评论 -
【深度学习总结】【深度学习-2018-年度总结】【计算机视觉】【预训练模型库】【神经网络技巧】【高性能计算】【人工智能】
时间:2018/12/20深度学习热潮:4年深度学习框架: 图片来源:http://m.elecfans.com/article/798648.html Pytorch可以说是用户数量提升最快的一个框架,上图来自于某位大佬的博客,时间节点2018年9月。现在pytorc...原创 2018-12-21 11:18:09 · 350 阅读 · 0 评论 -
【深度学习-计算机视觉】【视觉算法岗位,公司有哪些?】浅谈当下“互联网寒冬”,为何都说算法岗越来越难找?
为什么要谈这个:再过几个月就是“春招”,虽然三月份还没到,但是已经火药味十足,各大企业已经开始招收实习生,并且给出了不少转正名额!当下在硕士生圈流传着一句话“大厂实习经历抵得上一篇论文!”,让不少因“种种原因”不能去实习的小伙伴,面红耳赤,两字“上火!!!”。但是不无道理,人家去实习了,相当于去“展示自己的才艺”,展示的好自然可以留下来,不好也算是个经历!开门见山-说一说目前国内有哪些可以去的...原创 2019-01-10 00:27:04 · 4485 阅读 · 2 评论 -
【医疗图像分割】【MICAI RETOUH 2017】Simultaneous Classification and Segmentation of Cysts inRetinal OCT
题目:Simultaneous Classification and Segmentation of Cysts in Retinal OCT前言:这篇文章,给出了一种新的U型CNN,可以同时给出分割以及检测结果,而且工作的意义在于,可以量化的给出患者OCT影像结果。关于数据集以及这个挑战赛的介绍可以看这篇博客https://blog.csdn.net/github_36923418/ar...原创 2019-01-20 17:00:19 · 828 阅读 · 0 评论