![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
torch
文章平均质量分 93
王飞95
毕业于中国科学技术大学,拥有20多年的开发经验。精通C++和各类多媒体架构和技术,熟悉多个领域技术规范和行业标准,尤其是多媒体领域;技术储备和知识面全面;擅长架构设计、应用性能优化和、跨平台移植以及各类难题调试和解决;领导和成功发布了数十项产品和项目,包括XBox One蓝光播放器等。在业界一直是可信赖的合作者和领导者。
展开
-
torchvision Faster-RCNN ResNet-50 FPN代码解析(ROI)
总体架构ROI对从RPN中选出来的1000个Proposal Boxes,以及从FPN中输出的多层特征图进行ROI Pool,对于box中的对象进行分类,并再次进行Proposal Boxes偏移(offset/delta)数值回归,产生新的分数和再次微调的box,以及得到标签,最后再次进行非极大值抑制(NMS):基于FPN的ROI处理会比传统的Faster RCNN多出一些步骤,要更加复杂一些。主要包含如下步骤:Box ROI Pool,根据1000个Proposal box的面积,确定选择在原创 2020-10-11 22:31:47 · 2660 阅读 · 2 评论 -
torchvision Faster-RCNN ResNet-50 FPN代码解析(RPN)
总体架构RPNHead原创 2020-10-08 20:46:42 · 3043 阅读 · 2 评论 -
torchvision Faster-RCNN ResNet-50 FPN代码解析(总体结构)
总体结构首先花了点时间把整个代码架构理了理,画了如下这张图:主体部分分为这几大部分:Transform,主要是对输入图像进行转换Resnet-50,主要是特征提取FPN,主要是构建特征金字塔给RPN提供输入特征RPN,主要是产生region proposalsROI,主要是检测object区域,各个区域的labels以及各个区域的scoresTransform请看torchvision Faster-RCNN ResNet-50 FPN代码解析(图片转换和坐标)Resnet-50原创 2020-10-07 17:52:10 · 10977 阅读 · 4 评论 -
torchvision Faster-RCNN ResNet-50 FPN代码解析(图片转换和坐标)
图像转换在torchvision\models\detection\faster_rcnn.py构造函数中,指定了image mean/std,这些前面笔记中都介绍了原因,这里不多说了,这里还指明了最大和最小的图像长宽,这里是800和1333,表明转换出来的图像不能超出800x1333或者1333x800这个尺寸。class FasterRCNN(GeneralizedRCNN): def __init__(self, backbone, num_classes=None,原创 2020-10-04 20:13:58 · 3099 阅读 · 1 评论 -
libtorch学习笔记(17)- ResNet50 FPN以及如何应用于Faster-RCNN
FPN,即Feature Pyramid Networks,是一种多尺寸,金字塔结构深度学习网络,使用了FPN的Faster-RCNN,其测试结果超过大部分single-model,包括COCO 2016年挑战的获胜模型。其优势是小尺寸对象的检测。torchvision中包含了ResNet50 FPN完整的源代码(这里参考的是torchvision 0.7.0里面的代码),这里就解读一下对应的实现,为了解释流畅,尽量采用ResNet50中的layer name,以及对应的参数:这里画了一个全局图,将原创 2020-09-19 22:15:34 · 10391 阅读 · 5 评论