- 博客(15)
- 收藏
- 关注
原创 Faster-RCNN 代码阅读笔记(二)
Faster-RCNN 代码阅读笔记(二)代码链接:https://github.com/chenyuntc/simple-faster-rcnn-pytorch先放出一张图,我觉得总结的不错,来自于这个博客3. VGG16RoIHead上面已经知道,RPN输出了2000个RoIs区域传入到RoIHead中。首先通过RoI pooling层使每个RoI生成固定尺寸的feature map,进入到后面可利用全连接操作来进行目标分类和定位。换句话说,ROI Pooling 就是将不同大小的roi 池化
2021-08-26 10:06:42 360
原创 Faster-RCNN 代码阅读笔记(一)
Faster-RCNN 代码阅读笔记(一)代码链接:https://github.com/chenyuntc/simple-faster-rcnn-pytorch可以看到,网络结构分为三个部分:Backbone: VGG16Region Proposal NetworkClassfication and Regression1. BackboneFaster-RCNN 是以VGG16作为backbone,代码具体如下:decom_vgg16 代码def decom_vgg16()
2021-08-26 10:03:37 543
原创 SPP-net 论文笔记
Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition SPP-net 论文链接: https://arxiv.org/abs/1406.4729一、 Problem Statement传统的网络结构设计由于包含了全连接层,因此需要固定大小的输入。以前的解决办法是用crop和warp来预处理图像,这样会使得精度由于信息的丢失或者变形导致降低。二、 Direction提出Spatial Pyram
2021-08-23 15:58:54 313
转载 Error string: Could not load library (Poco exception = libopencv_core3.so.3.3
[ERROR] [1618811104.099891119]: PluginlibFactory: The plugin for class ‘jsk_rviz_plugin/BoundingBoxArray’ failed to load. Error: Failed to load library /opt/ros/kinetic/lib//libjsk_rviz_plugins.so. Make sure that you are calling the PLUGINLIB_EXPORT_CLASS
2021-08-21 09:34:24 2191
原创 U-net 代码阅读笔记
U-net 代码阅读笔记论文阅读笔记可以参考这篇博客代码链接:https://github.com/milesial/Pytorch-UNet/blob/master/unet/unet_model.py先来看一下它的网络结构:先来看一下代码的整体结构,构建了一个UNet类,四个downsampling layers,四个upsampling layers和一个输出网络层。class UNet(nn.Module): def __init__(self, n_channels, n_cl
2021-08-20 15:30:51 549
原创 U-Net 论文笔记
U-Net: Convolutional Networks for Biomedical Image Segmentation U-net 论文链接: https://arxiv.org/abs/1505.04597一、 Problem Statement主要是医疗图像分割。二、 Direction构建一个收缩路径和扩张路径的网络----U-net。三、 Method网络结构图如下:整个网络拥有23个网络层,分别由两个部分组成:Contracting path: 两个3x3 conv
2021-08-20 14:35:37 159
原创 ResNet 代码阅读笔记
ResNet 代码阅读笔记论文笔记可以查看这篇博客。先来回顾以下网络的框架:可以看到,ResNet主要分为四个block。而对于层数不一样的结构,block也不一样。因此在代码中,需要定义两个block类,分别为BasicBlock和Bottleneck,如下所示:def conv3x3(in_planes, out_planes, stride=1): "3x3 convolution with padding" return nn.Conv2d(in_planes, out_pla
2021-08-19 15:58:16 349
原创 ResNet 论文笔记
Deep Residual Learning for Image RecognitionResNet论文链接: https://arxiv.org/abs/1512.03385一、 Problem Statement神经网络的深度很重要,但比较难训练。因此提出了一个问题: 学习更好的网络就像叠加更多层一样容易吗? 因为堆叠网络层会导致梯度的消失或者爆炸,导致在一开始就阻碍网络的收敛。这个问题很大程度可以由标准初始化和中间标准化层来解决,但是 学习退化(degradation) 的问题就出现了。 随着
2021-08-19 15:30:38 171
原创 VGG 代码阅读笔记
VGG 代码阅读笔记论文链接: https://arxiv.org/abs/1409.1556v6论文阅读笔记可以查看这篇博客一、 网络结构VGG的网络结构具体如下所示:import torchimport torch.nn as nnfrom torchvision.models import vgg16cfg = { 'A' : [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'], 'B'
2021-08-18 14:47:08 176
原创 VGG-Net 论文笔记
VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG-net 论文链接: https://arxiv.org/abs/1409.1556v6一、 Problem Statement作者研究了网络的深度,与精度的关系。发现通过使用3x3卷积增加网络深度可以提升精度。二、 Direction增加网络深度。三、 Method两个3x3卷积层(在中间没有spatial pooling)堆叠在一起的感知域是5x5,
2021-08-18 14:38:53 146
原创 DeepLab V3++ 论文笔记
Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLab v3++ 论文链接: https://arxiv.org/abs/1802.02611DeepLab v1 论文笔记DeepLab v2 论文笔记DeepLab v3 论文笔记一、 Problem Statement作者认为SPP结构可以有效的提取multi-scale contextual information,
2021-08-17 15:04:19 441
原创 DeepLab V3 论文笔记
Rethinking Atrous Convolution for Semantic Image SegmentationDeeplab v3论文链接: https://arxiv.org/abs/1706.05587一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V2进行改进。提出了cascade和paralle的多尺度特征提取方法消除了条件随机场CRF二、 DirectionCasc
2021-08-16 16:24:52 277
原创 DeepLab V2 论文笔记
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFsDeeplab v2论文链接: https://arxiv.org/abs/1606.00915一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V1 进行改进。把VGG-16改为
2021-08-13 14:59:41 307
原创 DeepLab V1 论文笔记
SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFSDeeplab V1论文链接: https://arxiv.org/abs/1709.01507一、 Problem StatementCNN能够很好的处理图像分类的问题,因为具有很好的平移不变性(invariance)。但是对于处理目标分割问题,定位的能力就比较差,它们更需要准确的位置信息。主要是由两个问题所造成的:signal d
2021-08-11 16:25:53 190
原创 Squeeze-and-Excitation Networks 论文笔记
Squeeze-and-Excitation Networks论文链接: https://arxiv.org/abs/1709.01507一、 Problem Statement本论文关注channel之间的关系,提出了一个新的结构单元,SE block。 这个SE block可以自适应地重新校准通道特征响应, 这样就网络就可以学习使用全局信息来选择性地强调信息性特征,并抑制不太有用的特征。二、 Direction提出了一个新的结构单元: SE block。其分为两个部分,squeeze oper
2021-08-06 09:22:03 418
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人