![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
卷积神经网络
文章平均质量分 92
CSPhD-winston-杨帆
合作:winstonyf@qq.com 暨大博士生 川师大研究生 成都东软教师
展开
-
【SlowFast复现】SlowFast Networks for Video Recognition复现代码 使用自己的视频进行demo检测
一,准备1.1代码SlowFast官网地址代码下载:git clone https://github.com/facebookresearch/slowfast这里建议使用码云来下载,使用上面的那个命令实在太慢,码云下载方法:git clone 显著提速,解决Github代码拉取速度缓慢问题下载链接1.2 环境准备这里推荐几个网站,租用这些网站的GPU然后跑代码,因为普通的笔记本搭建图像处理的环境会遇到各种各样的问题。在网站上租用GPU可以使用官方搭建好的镜像,如果跑代码或者自己把环境弄原创 2021-02-01 21:44:49 · 24037 阅读 · 110 评论 -
【论文翻译】SlowFast Networks for Video Recognition
AbstractWe present SlowFast networks for video recognition. Our model involves (i) a Slow pathway, operating at low frame rate, to capture spatial semantics, and (ii) a Fast pathway, operating at high frame rate, to capture motion at fine temporal resolut原创 2021-01-14 16:27:23 · 1194 阅读 · 0 评论 -
【代码复现】BMN: Boundary-Matching Network for Temporal Action Proposal Generation
一,开始前的准备1.1,前言现在有那么多视频检测框架,为什么选BMN进行复现?1,2019 年 ActivityNet 夺冠方案2,这是中国人做出来的,而且作者在知乎也写了详细的讲解(这一点才是最重要的)3,BMN距离现在时间很近,能算是最前沿的技术,通过对BMN的改进,可以用作我的毕业论文的写作。1.2,参考资料ActivityNet Challenge 2019 冠军模型BMN算法全解析[ICCV 2019][时序动作提名] 边界匹配网络详解github代码1.3,系统、深度学习框架原创 2021-01-06 18:42:15 · 1424 阅读 · 5 评论 -
【代码复现失败】BMN: Boundary-Matching Network for Temporal Action Proposal Generation
前言现在有那么多视频检测框架,为什么选BMN进行复现?1,2019 年 ActivityNet 夺冠方案2,这是中国人做出来的,而且作者在知乎也写了详细的讲解(这一点才是最重要的)3,BMN距离现在时间很近,能算是最前沿的技术,通过对BMN的改进,可以用作我的毕业论文的写作。参考ActivityNet Challenge 2019 冠军模型BMN算法全解析[ICCV 2019][时序动作提名] 边界匹配网络详解github代码准备1,ubuntu系统,我用的是ubuntu162,Pad原创 2021-01-05 14:40:01 · 724 阅读 · 2 评论 -
论文笔记(十三)【Resnet Resnet50】残差网络
1,参考ResNet网络结构,BN以及迁移学习详解神经网络学习小记录20——ResNet50模型的复现详解2,什么是残差网络Residual net(残差网络):将靠前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。意味着后面的特征层的内容会有一部分由其前面的某一层线性贡献。其结构如下:深度残差网络的设计是为了克服由于网络深度加深而产生的学习效率变低与准确率无法有效提升的问题。由于梯度消失,深层网络很难训练。因为梯度反向传播到前面的层,重复相乘可能使梯度无穷小。结果就是,随着原创 2020-12-22 10:09:48 · 2690 阅读 · 1 评论 -
论文笔记(十二)【论文中概念解释2】split merge、Bottleneck Layer、IOU
1,split()函数+merge()函数在图像处理时,我们接触到的彩色以RGB居多,为了分析图像在某一通道上的特性,需要将图像的颜色通道进行分离,或者是在对某一颜色通道处理后重新进行融合。split()和merge()方法是一对互逆操作,split()是对图像进行通道分离,merge()是进行通道合并,灰度图像只有1个通道,一般RGB能分离出3个通道,RGBA图像能分理出4个通道(如.png格式图片)2,Bottleneck Layer2.1 什么是瓶颈层Bottleneck layer又称之为原创 2020-12-21 13:29:08 · 955 阅读 · 0 评论 -
论文笔记(十一)【yolov4】详细解析 YOLOv4: Optimal Speed and Accuracy of Object Detection
YOLOV4结构解析1,YOLOV4改进的部分(不完全)2、主干特征提取网络Backbone3、特征金字塔4、YoloHead利用获得到的特征进行预测5,补充5.1 yolov4可视化结构(很长)5.2 yolov3结构何yolov4结构对比5.4 yolov4 思维导图5.3 Mish:一个新的state of the art的激活函数,ReLU的继任者5.4 SPP5.5参考:睿智的目标检测29——Keras搭建YoloV4目标检测平台Mish:一个新的state of the art的激活函数,原创 2020-12-19 17:04:51 · 2054 阅读 · 1 评论 -
论文笔记(十)【yolov4】YOLOv4: Optimal Speed and Accuracy of Object Detection
参考:YOLOv4原文翻译 - v4它终于来了!AbstractThere are a huge number of features which are said to improve Convolutional Neural Network (CNN) accuracy. Practical testing of combinations of such features on large datasets, and theoretical justification of the result,原创 2020-12-18 13:01:39 · 356 阅读 · 0 评论 -
论文笔记(九)【论文中概念解释1】1x1卷积核的作用、机器学习中的正负样本、消融实验、ROIpooling、空间金字塔池化(Spatial Pyramid Pooling, SPP)、backbone
1x1卷积核的作用、机器学习中的正负样本、消融实验、ROIpooling、空间金字塔池化(Spatial Pyramid Pooling, SPP)原创 2020-12-17 21:12:11 · 1063 阅读 · 0 评论 -
论文笔记(七)【yolo v3】You Only Look Once: Unified, Real-Time Object Detection
AbstractWe present YOLO, a new approach to object detection. Prior work on object detection repurposes classifiers to perform detection. Instead, we frame object detection as a regression problem to spatially separated bounding boxes and associated class原创 2020-12-15 11:14:44 · 361 阅读 · 0 评论 -
论文笔记(六)【特征金字塔】Feature Pyramid Networks for Object Detection
《Feature Pyramid Networks for Object Detection》这篇论文主要解决的问题是目标检测在处理多尺度变化问题是的不足,现在的很多网络都使用了利用单个高层特征(比如说Faster R-CNN利用下采样四倍的卷积层——Conv4,进行后续的物体的分类和bounding box的回归),但是这样做有一个明显的缺陷,即小物体本身具有的像素信息较少,在下采样的过程中极易被丢失,为了处理这种物体大小差异十分明显的检测问题,经典的方法是利用图像金字塔的方式进行多尺度变化增强,但这样会原创 2020-12-14 10:08:37 · 1095 阅读 · 1 评论 -
械臂论文笔记(三)【抓取检测】机器人抓取检测技术的研究现状 刘亚欣
作为机器人在工厂、家居等环境中最常用的基础动作,机器人自主抓取有着广泛的应用前景,近十年来研究人员对其给予了较高的关注,然而,在非结构环境下任意物体任意姿态的准确抓取仍然是一项具有挑战性和复杂性的研究. 机器人抓取涉及3个主要方面:检测、规划和控制. 作为第1步,检测物体并生成抓取位姿是成功抓取的前提,有助于后续抓取路径的规划和整个抓取动作的实现. 鉴于此,以检测为主进行文献综述,从分析法和经验法两大方面介绍抓取检测技术,从是否具有抓取物体先验知识的角度出发,将经验法分成已知物体和未知物体的抓取,并详细描述原创 2020-12-11 11:10:03 · 6258 阅读 · 1 评论 -
10分钟看懂全卷积神经网络( FCN ):语义分割深度模型先驱
10分钟看懂全卷积神经网络( FCN ):语义分割深度模型先驱全卷积神经网络( FCN )转载 2020-01-08 20:32:59 · 358 阅读 · 0 评论