![](https://img-blog.csdnimg.cn/20191111195058990.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
经典神经网络论文解读及代码实现
文章平均质量分 87
主流神经网络框架AlexNet,vggnet,Resnet、fast Rcnn等论文解读和代码实现
小小谢先生
拿过大厂、银行、国企、事业单位、研究所等公司offer。
致力于信创产业,人工智能布道者
展开
-
CVPR2022 | 动作识别框架新范式 STRM,用最小的样本获得最高的精度
少动作识别原创 2022-12-13 22:13:06 · 1132 阅读 · 0 评论 -
经典/最新计算机视觉论文及代码推荐
经典神经网络原创 2022-08-08 22:38:15 · 1012 阅读 · 0 评论 -
CNN模型合集 | Resnet变种-WideResnet解读
Resnet变体-wideresnet原创 2022-06-19 11:55:38 · 6637 阅读 · 1 评论 -
自动数据增强论文及算法解读(附代码)
论文题目 AutoAugment: Learning AugmentationStrategies from Data 代码:https://github.com/DeepVoltaire/AutoAugment Abstract数据增强是提高图像分类器精度的有效技术。但是当前的数据增强实现是手工设计的。在本论文中,我们提出了AutoAugment来自动搜索改进数据增强策略。我们设计了一个搜索空间,其中一个策略由许多子策略组成,每个小批量的每个图像随机选择一个子策略。子策略由两个操.原创 2022-05-09 11:25:04 · 1245 阅读 · 0 评论 -
CenterNet+ deepsort实现多目标跟踪
CenterNet+ deepsort实现多目标跟踪首先使用CenterNet训练自己的检测数据集,可以检测人、动物、鱼大等多种自定义类别,然后再把训练好的预训练模型传入deepsort算法进行多目标跟踪。试验结果表明centernet精度和速度方面都具有更好的优势。CenterNet简介论文:https://arxiv.org/abs/1904.08189传统的基于关键点的目标检测方法例如最具代表性的 CornerNet通过检测物体的左上角点和右下角点来确定目标,但在确定目标的过程中,原创 2020-11-28 20:18:35 · 2062 阅读 · 6 评论 -
多人姿态识别框架——AlphaPose
多人姿态识别简介人体姿态估计有两个主流方案:Two-step framework 和Part-based framework。第一种方案是检测环境中的每一个人体检测框,然后独立地去检测每一个人体区域的姿态(自顶向下的方法)。第二种方案是首先检测出环境中的所有肢体节点,然后进行拼接得到多人的骨架(自底向上的方法)。第一种方案,姿态检测准确度高度以来目标区域框检测的质量。第二种方案,如果两人离得十分近,容易出现模棱两可的情况,而且由于是依赖两个部件之间的关系,所以失去了对全局的信息获取。AlphaPos原创 2020-11-24 18:07:49 · 6187 阅读 · 6 评论 -
时空图卷积神经网络(st-gcn)论文解读
下面是博主认为解读st-gcn论文里两篇写的非常不错的文章,特此摘录下来以飨读者。解读一:https://zhoef.com/2019/08/24/14_ST-Gcn/解读二:https://www.cnblogs.com/shyern/p/11262926.html#_label3_1转载 2020-11-05 14:56:16 · 4842 阅读 · 0 评论 -
cfg文件搭建神经网络并用pytorch读取创建模型
cfg是配置文件,一般为了代码的可读性,把一层层的神经网络用cfg格式文件保存,用的时候可以直接读取调用,简单轻便。以下用一个例子来了解。下面cfg文件是yolov3的网络层次:[net]# Testingbatch=1subdivisions=1# Training# batch=64# subdivisions=2width=416height=416channels=3momentum=0.9decay=0.0005angle=0saturation = 1.5e原创 2020-10-24 16:49:43 · 3801 阅读 · 15 评论 -
经典神经网络 | 从Inception v1到Inception v4全解析
本文介绍了 Inception 家族的主要成员,包括 Inception v1、Inception v2 、Inception v3、Inception v4 和 Inception-ResNet。它们的计算效率与参数效率在所有卷积架构中都是顶尖的。Inception 网络是CNN分类器发展史上一个重要的里程碑。在 Inception 出现之前,大部分流行 CNN 仅仅是把卷积层堆叠得越来越多,使网络越来越深,以此希望能够得到更好的性能。例如AlexNet,GoogleNet、 VGG-Net、.原创 2020-08-22 23:20:48 · 1447 阅读 · 0 评论 -
PaddlePaddle顶会论文复现 | ECO视频动作识别网络
论文题目:ECO: Efficient Convolutional Network for Online Video Understanding 论文链接:https://arxiv.org/abs/1804.09066 代码链接:https://github.com/mzolfaghari/ECO-pytorch 此次课程是由百度组织,GPU和算力都是百度提供,课程链接如下:https://aistudio.baidu.com/aistudio/education/grou..原创 2020-08-06 16:37:05 · 1200 阅读 · 0 评论 -
VGG-M神经网络
目标跟踪论文一般提到VGG-M神经网络,也就是CNN-M神经网络,其出处是论文《Return of the Devil in the Details:Delving Deep into Convolutional Nets》,其定义如下:其架构包含5个卷积层和3个全连接层,它的特点是第一个卷积层的步幅减小和感受野较小,这在ILSVRC数据集上被证明是有益的。同时,conv2使用更大的步幅(stride=2而不是1)来保持合理的计算时间。还在conv4层使用更少的过滤器(512)。...原创 2020-07-10 16:18:13 · 3746 阅读 · 2 评论 -
经典神经网络 | Faster R-CNN论文解析
论文题目:Faster R-CNN: T owards Real-Time Object Detection with Region Proposal Networks 论文链接:https://arxiv.org/abs/1506.01497 作者及单位研究目标Faster R-CNN是为了改进Fast R-CNN而提出来的。因为在Fast R-CNN文章中的测试时间是不包括search selective时间的,而在测试时很大的一部分时间要耗费在候选区域的提取上。所以作者提..原创 2020-05-21 00:23:06 · 1894 阅读 · 10 评论 -
再谈注意力机制 | 运用强化学习实现目标特征提取
论文题目:Recurrent Models of Visual Attention 论文链接:http://www.oalib.com/paper/4082117 作者及单位研究目标研究如何减少图像相关任务的计算量, 提出通过使用attention based RNN模型建立序列模型(recurrent attention model, RAM), 每次基于上下文和任务来适应性的选择输入的的image patch, 而不是整张图片, 从而使得计算量独立于图片大小, 从而缓解CN..原创 2020-05-18 22:50:35 · 6165 阅读 · 11 评论 -
轻量化网络MobileNet解析
论文题目:MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 论文链接:https://arxiv.org/abs/1704.04861 论文研究目标提出了一种深度模型加速的算法,可以在基本不影响准确率的前提下大大减少计算时间和参数数量。为移动和嵌入式视觉应用...原创 2020-04-29 15:56:22 · 1878 阅读 · 8 评论 -
注意力机制BAM和CBAM详细解析(附代码)
论文题目①:BAM: Bottleneck Attention Module论文题目②:CBAM:CBAM: Convolutional Block Attention ModuleBottlenet attention Module(BAM)依据人看东西时不可能把注意力放在所有的图像上,会把焦点目光聚集在图像的重要物体上。因此,作者提出了BAM注意力机制,仿照人的眼睛聚焦在图像几个重...原创 2020-04-26 00:17:41 · 24820 阅读 · 13 评论 -
可变形卷积神经网络 | Deformable Network
论文标题:Deformable Convolutional Networks 论文链接:https://arxiv.org/abs/1703.06211 所要解决的问题视觉识别的关键挑战是如何在对象比例、姿势等形变问题上适应几何变化或对几何转换建模。一般情况下有以下两种方法: 1、通常是对数据集进行仿射变换。如角度变化、剪切等以此来扩充数据集,增加算法的鲁棒性。 ...原创 2020-04-12 23:02:14 · 2155 阅读 · 14 评论 -
目标检测算法之FPN(附FPN代码实现)
论文题目:FeaturePyramidNetworksforObjectDetection论文链接:https://arxiv.org/abs/1612.03144所要解决的问题针对小目标检测网络,CV领域一般用的是特征金字塔。即将原图以不同的比例采样,然后得到不同分辨率的图像进行训练和测试,在多数情况下是有效的。但是特征金字塔的计算、内存和时间开销都非常大,导致在工程中应用是及其困难...原创 2020-04-05 22:05:42 · 7626 阅读 · 12 评论 -
fast rcnn 论文解读(附代码链接)
要解决的问题 1、RCNN和SPPnet分多步训练,先要fine tuning一个预训练的网络,然后针对每个类别都训练一个SVM分类器,最后还要用regressors对bounding-box进行回归,另外region proposal也要单独用selective search的方式获得,步骤比较繁琐。 2、时间和内存消耗比较大。在训练SVM和回归的时候需要用网络训练的特征作为输入...原创 2020-04-03 22:26:16 · 2722 阅读 · 3 评论 -
GoogLenet网络解读及代码实现(Pytorch)
论文题目:Going deeper with convolutions论文链接:https://arxiv.org/abs/1409.4842论文研究目标利用赫布理论和多尺度处理直觉设计一种增加深度和宽度的提高内部计算资源利用率的(同时保持了计算预算不变)网络。网络主要结构...原创 2020-02-22 21:59:51 · 3195 阅读 · 0 评论 -
resnet论文解读及代码实现
ResNet是2015年ImageNet比赛的冠军,将识别错误率降低到了3.6%,这个结果甚至超出了正常人眼识别的精度。通过观察学习vggnet等经典神经网络模型,我们可以发现随着深度学习的不断发展,模型的层数越来越多,网络结构也越来越复杂。那么是否加深网络结构,就一定会得到更好的效果呢?从理论上来说,假设新增加的层都是恒等映射,只要原有的层学出跟原模型一样的参数,那么深模型结构就能达到原模型...原创 2020-02-09 18:13:41 · 2625 阅读 · 1 评论 -
动态滤波网络论文解读
论文题目:Dynamic Filter Networks论文链接:https://arxiv.org/pdf/1605.09673.pdfsummary在传统的卷积层中,经过训练后的学习滤波器保持不变。相反本篇论文引入了一种动态过滤器网络,根据输入动态生成,但是却没有过多地增加模型参数的数量。动态滤波网络组成总体框架如下图所示:动态滤波网络由过滤生成网络和动态过滤层组...原创 2020-02-03 17:33:51 · 3090 阅读 · 2 评论 -
VGGnet论文解读及代码实现
# Title文章标题VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION# Summary网络架构如下图:卷积神经网络的输入是一个固定大小的224×224 RGB图像。做的唯一预处理是从每个像素中减去在训练集上计算的RGB平均值。图像通过一堆卷积(conv.)层传递,我们使用带有非常小的接受域的过...原创 2020-01-07 17:20:04 · 1530 阅读 · 0 评论 -
FPN论文解读(附网络结构层次代码)
这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,解决了多尺度目标的检测问题。# 论文题目FeaturePyramidNetworksforObjectDetection论文链接:https://arxiv.org/abs/1612.03144#论文解读FPN网络结构图a 多尺度金字塔 这是一个特征图像金字塔,整个过程是先对原始图像构造图像金字...原创 2019-12-06 10:08:20 · 1150 阅读 · 0 评论 -
Alexnet论文解读及代码实现
本文首发于微信公众号“计算机视觉cv”# Title文章标题ImageNet classification with deep revolutional Neural Networks(也就是经典的Alexnet网络)# Summary作者使用ImageNet更大的数据集来训练神经网络。1、激活函数与传统论文使用的tanh和sigmoid激活函数不同,本论文使用的是非...原创 2019-11-29 11:20:23 · 1082 阅读 · 0 评论 -
Lenet神经网络实现
手写字体识别模型LeNet5诞生于1994年,是最早的卷积神经网络之一。LeNet5通过巧妙的设计,利用卷积、参数共享、池化等操作提取特征,避免了大量的计算成本,最后再使用全连接神经网络进行分类识别,这个网络也是最近大量神经网络架构的起点。虽然现在看来Lenet基本实际用处不大,而且架构现在基本也没人用了,但是可以作为神经网络架构的一个很好的入门基础。Lenet神经网络架构图如下:Le...原创 2019-11-11 19:54:57 · 849 阅读 · 0 评论