深度学习算法总结
文章平均质量分 69
总结深度学习过程中算法学习
li三河
图像算法、3D开发、深度学习
展开
-
(七)标签分配
标签分配策略,是一个预定义的规则,能够分配每个anchor的正负,也就是一个gt会对应多个anchor。1、ATSS2、OTA: Optimal Transport Assignment for Object Detection3、Freeanchor、AutoAssign 等通过使用预测的 confidence score 来动态分配正负原创 2022-12-07 16:06:17 · 1385 阅读 · 0 评论 -
(六)深度学习面试总结
1、nms和soft-nms实现过程(1) nms实现过程初始时,非极大值抑制过程开始于一个检测框列表B、对应的置信度标S、空的检测列表D、阈值N_t。首先,找到最高置信度对应的检测框M,将其从B中删除,并添加到最终框列表D中。然后,计算M与B中其他检测框的重叠程度IOU,将IOU大于阈值N_t的目标检测从B中删除。对于B中剩余的检测框,继续重复这个过程,直到B为空时结束。(2) soft nms解决哪些问题nms的一个主要问题是,将与NMS重叠度大于阈值的其他检测框直接从B中删除。造成如果原创 2022-02-21 22:24:14 · 1088 阅读 · 0 评论 -
(五)目标检测- 基于候选区域的目标检测器
1、RCNN的关键点(1) 用selective search生产RP(Region Proposals),RP的大小不一样,之后通过warp,把RP变成统一的227*227的大小(2) 将227*227的RP输入到CNN中进行特征提取(3) 用独立的SVM对RP进行特征分类(4) 用Bb回归(Bounding box regression)校正原来的RP,生产预测窗口的坐标2、fast rcnn(1)用Selective Search生成约2K个RP(2)整张图像输入C..原创 2022-02-15 19:08:51 · 849 阅读 · 0 评论 -
(四)目标检测- YoloV3和SSD对比
SSD的loss中,不同类别的分类器是softmax,最终检测目标的类别只能是一类。而在yolo-v3中,例如对于80类的coco数据集,对于类别进行判断是80个logistic分类器,只要输出大于设置的阈值,则都是物体的类别,物体同时可以属于多类,例如一个物体同时是person和woman。SSD损失函数分为两个部分:对应搜索框的位置loss(loc)和类别置信度loss(conf).i指代搜索框序号,j指代真实框序号,p指代类别序号,p=0表示背景,中取1表示此时第i个搜索框和第j个类别框...原创 2022-02-15 16:34:09 · 2574 阅读 · 0 评论 -
(三)目标检测-单次目标检测器总结
1、YOLO1具体做法:将image划分为S*S个网格,每个网络预测B个bbox的位置(x,y,w,h)、置信度(confidence为交并比)、类别概率。输出维度为S*S*(B*5+C),C为类别数。无论网格中包含多少个boxes,每个网格只预测一组类概率。测试时,将条件类概率和预测框的置信度乘起来,表示每个box包含某类物体的置信度,这个分数可以将box中的类别可能性和预测精确度同时表示出来。基本网络模型为Google net,但未使用inception模块,而是交替使用1*1和3*3卷积层。原创 2022-02-15 16:28:12 · 416 阅读 · 0 评论 -
(二)目标分割-激光点云语义分割RangeNet++优化
本人主要对RangeNet++的前后处理进行优化,移植GPU运行原创 2021-12-16 16:15:27 · 1549 阅读 · 0 评论 -
(一)CNN网络结构
1、开山之作:LeNet对经典LeNet-5做深入分析:1)输入图像是单通道的28*28大小的图像,矩阵表示[28,28,1]2)conv1所用卷积核尺寸5*5,滑动步长1,卷积核数目20,该层后图像尺寸变为28-5+1=24,输出矩阵[24,24,20]3)pool1核尺寸为2*2,步长2,输出矩阵[12,12,20]4)conv2所用卷积核尺寸5*5,滑动步长1,卷积核数目50,该层后图像尺寸变为12-5+1=8,输出矩阵[8,8,50]5)pool2核尺寸为2*2,步长2,输出原创 2022-02-15 19:54:45 · 3245 阅读 · 0 评论