深度学习
GeneralJing
这个作者很懒,什么都没留下…
展开
-
YOLO中letterbox_image相关解释
pytorch实现YOLO中对输入图像尺寸进行调整,满足输入的尺寸要求,比如412*412或者320*320def letterbox_image(img, inp_dim): """ lteerbox_image()将图片按照纵横比进行缩放,将空白部分用(128,128,128)填充,使图像尺寸满足输入要求 具体操作就是,某个边正好可以等于目标长度,另一边小于等于目标长度 将缩放后的数据拷贝到画布中心,即可完成输入变换 """ img_w, img_h原创 2021-04-11 18:20:28 · 2363 阅读 · 1 评论 -
非极大值抑制-NMS
在目标检测任务中,滑动窗口经过特征提取和分类器识别后,每个窗口会得到一个分数,但滑动窗口胡导致很多窗口之间存在较大交叉重叠的情况,使用NMS可以选取在相邻区域相互交叉但得分最高的候选框,剔除那些得分低的候选框。检测之后的候选框集合用B表示,每个候选框的置信度用S表示,IOU阈值设置为T,NMS的实现步骤可以总结为:1.在候选框集合B中选择具有最大置信度S的候选框M2.将M从候选框集合B中移除,并加入到最终的检测结果D中3.将B中剩余候选框和M进行IOU计算,从B中剔除IOU值大于阈值T的候选原创 2021-04-08 06:53:46 · 144 阅读 · 0 评论 -
FPN相关理解
不同尺寸的特征图对应的感受野不同,进而特征图所能表达的信息抽象程度也有所区别。浅层的特征图(对应大尺寸的特征图)感受野小,比较适合检测小目标(要检测大目标,则其只“看”到了大目标的一部分,有效信息不够);深层的特征图(对应小尺寸的特征图)感受野大,适合检测大目标(要检测小目标,则其”看“到了太多的背景噪音,冗余噪音太多,学不到小目标的有效信息)。所以,有文章就提出了将不同尺寸的特征图,融合之后进行预测,来提升目标检测的性能,特征金字塔网络[FPN]的主要思想就是这个。...原创 2021-03-27 07:48:46 · 313 阅读 · 0 评论 -
模型预处理均值、方差的理解与使用
数据预处理常用的均值与方差如下:if 'coco' in args.dataset: mean_vals = [0.471, 0.448, 0.408] std_vals = [0.234, 0.239, 0.242]elif 'imagenet' in args.dataset: mean_vals = [0.485, 0.456, 0.406] std_vals = [0.229, 0.224, 0.225]对自定义数据集图像计算均值与方差:import原创 2020-11-05 11:23:16 · 1346 阅读 · 0 评论 -
torch2trt工具转换模型
利用torch2trt工具进行模型加速时,得到的模型大小会变大,后来查到的官方回复如下:TensorRT makes tradeoffs between memory usage and performance that can increase the size of the memory reserved by the plan files. This is something that is being actively investigated and improved upon.Howe原创 2020-10-11 08:09:54 · 1466 阅读 · 0 评论 -
论文:Network Slimming----阅读笔记
这篇文章利用通道稀疏化这样一个简单但很有效的方法,可以有效解决CNN网络在现实应用中部署时面临的三大挑战:1.模型大2.推理时占用内存开销大3.计算量大在这篇论文中,提出了网络瘦身,它解决了前面提到的所有挑战。方法是将L1正则化施加到BN层的缩放因子上,L1正则化推动BN层的缩放因子趋向于零,因为每一个缩放因子都和一个特定的CNN卷积通道(或者全连接层的一个神经元)相关联,这样就能够鉴别出不重要的通道或者神经元,利用这点可以进行后续的通道剪枝,另外正则化也很少损伤性能,甚至一些情况下它会导致原创 2020-10-11 07:34:34 · 270 阅读 · 0 评论 -
1*1卷积的作用
主要是下面几个:1.改变通道: 通道的升维与降维,不改变图像的宽高 通道间的数据融合 减少计算量2.增加非线性原创 2020-10-10 14:23:55 · 228 阅读 · 0 评论