2021年08月_Tianchao龙虾

原创 Faster-RCNN 代码阅读笔记(二)

Faster-RCNN 代码阅读笔记(二)代码链接:https://github.com/chenyuntc/simple-faster-rcnn-pytorch先放出一张图，我觉得总结的不错，来自于这个博客3. VGG16RoIHead上面已经知道，RPN输出了2000个RoIs区域传入到RoIHead中。首先通过RoI pooling层使每个RoI生成固定尺寸的feature map,进入到后面可利用全连接操作来进行目标分类和定位。换句话说，ROI Pooling 就是将不同大小的roi 池化

2021-08-26 10:06:42 360

原创 Faster-RCNN 代码阅读笔记(一)

Faster-RCNN 代码阅读笔记(一)代码链接:https://github.com/chenyuntc/simple-faster-rcnn-pytorch可以看到，网络结构分为三个部分:Backbone: VGG16Region Proposal NetworkClassfication and Regression1. BackboneFaster-RCNN 是以VGG16作为backbone，代码具体如下:decom_vgg16 代码def decom_vgg16()

2021-08-26 10:03:37 543

原创 SPP-net 论文笔记

Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition SPP-net 论文链接: https://arxiv.org/abs/1406.4729一、 Problem Statement传统的网络结构设计由于包含了全连接层，因此需要固定大小的输入。以前的解决办法是用crop和warp来预处理图像，这样会使得精度由于信息的丢失或者变形导致降低。二、 Direction提出Spatial Pyram

2021-08-23 15:58:54 313

转载 Error string: Could not load library (Poco exception = libopencv_core3.so.3.3

[ERROR] [1618811104.099891119]: PluginlibFactory: The plugin for class ‘jsk_rviz_plugin/BoundingBoxArray’ failed to load. Error: Failed to load library /opt/ros/kinetic/lib//libjsk_rviz_plugins.so. Make sure that you are calling the PLUGINLIB_EXPORT_CLASS

2021-08-21 09:34:24 2191

原创 U-net 代码阅读笔记

U-net 代码阅读笔记论文阅读笔记可以参考这篇博客代码链接:https://github.com/milesial/Pytorch-UNet/blob/master/unet/unet_model.py先来看一下它的网络结构:先来看一下代码的整体结构，构建了一个UNet类，四个downsampling layers，四个upsampling layers和一个输出网络层。class UNet(nn.Module): def __init__(self, n_channels, n_cl

2021-08-20 15:30:51 549

原创 U-Net 论文笔记

U-Net: Convolutional Networks for Biomedical Image Segmentation U-net 论文链接: https://arxiv.org/abs/1505.04597一、 Problem Statement主要是医疗图像分割。二、 Direction构建一个收缩路径和扩张路径的网络----U-net。三、 Method网络结构图如下:整个网络拥有23个网络层，分别由两个部分组成:Contracting path: 两个3x3 conv

2021-08-20 14:35:37 159

原创 ResNet 代码阅读笔记

ResNet 代码阅读笔记论文笔记可以查看这篇博客。先来回顾以下网络的框架:可以看到，ResNet主要分为四个block。而对于层数不一样的结构，block也不一样。因此在代码中，需要定义两个block类，分别为BasicBlock和Bottleneck，如下所示:def conv3x3(in_planes, out_planes, stride=1): "3x3 convolution with padding" return nn.Conv2d(in_planes, out_pla

2021-08-19 15:58:16 349

原创 ResNet 论文笔记

Deep Residual Learning for Image RecognitionResNet论文链接: https://arxiv.org/abs/1512.03385一、 Problem Statement神经网络的深度很重要，但比较难训练。因此提出了一个问题: 学习更好的网络就像叠加更多层一样容易吗？因为堆叠网络层会导致梯度的消失或者爆炸，导致在一开始就阻碍网络的收敛。这个问题很大程度可以由标准初始化和中间标准化层来解决，但是学习退化(degradation) 的问题就出现了。随着

2021-08-19 15:30:38 171

原创 VGG 代码阅读笔记

VGG 代码阅读笔记论文链接: https://arxiv.org/abs/1409.1556v6论文阅读笔记可以查看这篇博客一、网络结构VGG的网络结构具体如下所示:import torchimport torch.nn as nnfrom torchvision.models import vgg16cfg = { 'A' : [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'], 'B'

2021-08-18 14:47:08 176

原创 VGG-Net 论文笔记

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG-net 论文链接: https://arxiv.org/abs/1409.1556v6一、 Problem Statement作者研究了网络的深度，与精度的关系。发现通过使用3x3卷积增加网络深度可以提升精度。二、 Direction增加网络深度。三、 Method两个3x3卷积层(在中间没有spatial pooling)堆叠在一起的感知域是5x5，

2021-08-18 14:38:53 146

原创 DeepLab V3++ 论文笔记

Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLab v3++ 论文链接: https://arxiv.org/abs/1802.02611DeepLab v1 论文笔记DeepLab v2 论文笔记DeepLab v3 论文笔记一、 Problem Statement作者认为SPP结构可以有效的提取multi-scale contextual information，

2021-08-17 15:04:19 441

原创 DeepLab V3 论文笔记

Rethinking Atrous Convolution for Semantic Image SegmentationDeeplab v3论文链接: https://arxiv.org/abs/1706.05587一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V2进行改进。提出了cascade和paralle的多尺度特征提取方法消除了条件随机场CRF二、 DirectionCasc

2021-08-16 16:24:52 277

原创 DeepLab V2 论文笔记

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFsDeeplab v2论文链接: https://arxiv.org/abs/1606.00915一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V1 进行改进。把VGG-16改为

2021-08-13 14:59:41 307

原创 DeepLab V1 论文笔记

SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFSDeeplab V1论文链接: https://arxiv.org/abs/1709.01507一、 Problem StatementCNN能够很好的处理图像分类的问题，因为具有很好的平移不变性(invariance)。但是对于处理目标分割问题，定位的能力就比较差，它们更需要准确的位置信息。主要是由两个问题所造成的:signal d

2021-08-11 16:25:53 190

原创 Squeeze-and-Excitation Networks 论文笔记

Squeeze-and-Excitation Networks论文链接: https://arxiv.org/abs/1709.01507一、 Problem Statement本论文关注channel之间的关系，提出了一个新的结构单元，SE block。这个SE block可以自适应地重新校准通道特征响应, 这样就网络就可以学习使用全局信息来选择性地强调信息性特征，并抑制不太有用的特征。二、 Direction提出了一个新的结构单元: SE block。其分为两个部分，squeeze oper

2021-08-06 09:22:03 418

Tianchao龙虾