Chan_Zeng-CSDN博客

原创逐字理解目标检测simple-faster-rcnn-pytorch-master代码（一）

最近开始学习目标检测faster rcnn，首先看了很多博客讲解原理，然后从github上下载tensorflow版本的代码，代码太长看了好几天没明白，后来看到了chenyuntc的 simple-faster-rcnn-pytorch，很佩服作者手写目标检测代码，作者是从tf版本的改为pytorch版的。在学习的过程中也查阅了很多其他人写的博客，得到了很大的帮助，所以也打算把自己一些粗浅的理解记...

2018-12-04 18:20:05 21980 99

原创图像篡改数据集整理

图像篡改数据集和下载链接

2022-11-29 14:54:19 5232 12

原创 Transformer用于目标检测- End-to-End Object Detection with Transformers

文章目录传统方法存在的问题该方法的创新点思想与具体内容实验结果分析传统方法存在的问题当前的目标检测方法（比如Faster RCNN、YOLO与CenterNet等）都不够直观，存在以下两点问题：不直接预测目标框，而是使用替代的回归和分类去处理大量的propoasls、anchors或者window centers；模型的效果会受到一系列问题的影响：后处理去消除大量重叠框、anchors的设计、怎么把目标框与anchor关联起来。优点借鉴机器翻译和语音识别，二分匹配损失和非自回归t

2021-03-30 17:39:51 6380 2

原创 Pytorch model.train 与 model.eval的区别（我是搬运工）

参考文章1知乎参考文章2博客参考文章3博客model.eval()，Pytorch会自动把BN和Dropout固定住，不会取平均，而是用训练好的值。不然的话，一旦test的batch_size过小，很容易就会被BN层导致生成图片颜色失真极大；在模型测试阶段使用model.train() 让model变成训练模式，此时 dropout和batch normalization的操作在训练q起到防...

2019-11-04 11:09:30 3269 4

原创 YOLACT：Real-time Instance Segmentation总结

YOLACT：Real-time Instance Segmentation这篇文章精度不高（mAP=29.8%），但是速度上有了较大的提升（33fps），能够达到实时级别。文中提到训练时只用了一个GPU，titanx。我下载源码用4块1080Ti卡跑的时候，采用COCO2014数据集，默认max_iter为400000次，batchsize为8，显示需要34天。看了下代码，感觉很复杂，数据预处...

2019-04-23 21:42:48 1922 1

原创牛客网OJ系统Python输入输出处理

刚开始在牛客网上做编程题，真的是崩溃，才发现连输入都不太会处理，作为一个整理狂，干啥都想要整理起来。以下是我在做题过程中遇见的几种输入情况以及处理方式，另外，本人超级喜欢用list，对于各种输入都想处理成list格式（持续更新）。输入的处理1. 对于一行输入多个的情况例如：[[1,2],[2,3]],4:方法一：L = list(eval(input()))array = L[0]t...

2019-04-17 11:23:55 10226 3

原创图像中的Attention代码（Tensorflow）

最近Attention广泛用于图像分割网络中，提升效果很明显。我也紧跟一波浪潮。这是基于Tensorflow的Attention实现。一块是针对区域Attention，一块是针对Channel的Attention。def PAM_module(inputs): inputs_shape = inputs.get_shape().as_list() batchsize, heigh...

2019-04-09 22:03:32 2989 10

原创（基础）CNN网络结构

参考博客1最近在准备找实习，对于面试中出现的常见问题（经典分类网络有哪些，它们的特点与发展过程）打算进行整理，也方便之后找实习的过程中复习。LeNet(LeNet5诞生于1994年，是最早的卷积神经网络之一，由Yann LeCun完成，推动了深度学习领域的发展)...

2019-04-04 18:24:04 3008 2

原创 Cityscapes数据集的介绍

一、下载链接官网：https://www.cityscapes-dataset.com/，官网也可以在benchmarks中查看大家神经网络达到的指标。百度云：https://pan.baidu.com/s/1fsbavgeEWZnrCRZlRHoVNg#list/path=%2F，需要解压gtFine.zip没有包含coarse的标注（来自本博客）二、数据集的结构特点该大型数据集包含来...

2019-03-07 09:35:39 14515 1

原创论文阅读 ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation

论文链接：https://arxiv.org/abs/1803.06815论文代码链接：https://github.com/sacmehta/ESPNetAbstract我们引入了一个快速有效的卷积神经网络ESPNet，用于资源约束下的高分辨率图像的语义分割。ESPNet基于一个新的卷积模块，即高效的空间金字塔（ESP），它在计算，存储和功率方面都很有效。目前最先进的语义分割网络PSPNe...

2019-01-10 21:48:00 1820 1

原创逐字理解目标检测simple-faster-rcnn-pytorch-master代码（四）

第三部分实在看得一知半懂，先跳过，直接先看第四部分好了。这部分主要讲的是trainer.py和train.py。而ProposalTargetCreator()的作用是从2000个筛选出的ROIS中再次选出128个ROIs用于训练，它的作用和前面的anchortargetCreator类似，不过它们服务的网络是不同的，前面anchortargetCreator服务的是RPN网络，而proposa...

2019-01-04 21:17:35 8494 19

原创逐字理解目标检测simple-faster-rcnn-pytorch-master代码（三）

第二部分生成RPN和ROI网络的输入部分真让我研究了好久，有些细节部分也是反复琢磨才明白，感觉代码还是要多写多看。接下来这部分是模型的原理，就是网络部分，分为基网络提取特征、RPN和ROI网络。感觉会有点难，终于涉及pytorch了，加油加油！...

2018-12-28 21:12:58 6955 21

原创逐字理解目标检测simple-faster-rcnn-pytorch-master代码（二）

最近刚看完数据预处理部分，想着一口气全部看完了，顺序还是参照网上有个作者的博客的顺序，加上自己的理解，代码块部分难以理解的地方都加上了批注。希望第二部分能够也很顺利，hiahiahia~第三步模型准备下面看的是model/util/文件夹，主要是进行一些配置文件首先看的是bbox_tools.py文件def loc2bbox(src_bbox, loc): if src_bbox...

2018-12-07 16:21:49 11370 43

qq_32678471的博客