Computer Vision
wslkd0123
这个作者很懒,什么都没留下…
展开
-
常见上采样(UpSampling)总结
上采样,即对图像或特征图进行扩充放大,生成我们所需要的尺寸,常用于特征融合。常用的上采样算法:1,最邻近元法最简单的一种上采样方法,不需要计算,在待求象素的四邻象素中,将距离待求象素最近的邻象素灰度赋给待求象素。优点是不需要计算开销小,但锯齿状明显。2,双线性内插法双线性内插法是利用待求象素四个邻象素的灰度在两个方向上作线性内插对于 (i, j+v),f(i, j)...原创 2020-08-09 10:30:50 · 3739 阅读 · 0 评论 -
FPN学习笔记
一,FPN:Feature Pyramid Networks for Object Detection关键创新点:多尺度预测,提高精度同时避免了传统的多尺度方法(image pyramid)的巨大开销。二,结构( Bottom-up + Top-down + Lateral connection)1,Bottem-up:从低到上的特征提取部分,输入为原始图片,输出一系列不同尺度的...原创 2020-08-09 10:30:57 · 257 阅读 · 0 评论 -
R-FCN笔记
↵R-FCN: Region-based Fully Convolutional Networks一,主要贡献1,使用position-sensitive score maps解决目标检测中的位置敏感性问题;2,提出基于区域的、全卷积、全部共享计算的网络。二,网络结构和faster r-cnn类似,如下图:最后一个卷积层会有3个分支:RPN和两个位置敏感得分图,位置...原创 2020-08-09 10:30:38 · 215 阅读 · 0 评论 -
SSD / DSSD学习笔记
一,SSDone-stage结构,在YOLO基础上加入先验框和多尺度预测。1,贡献(1)多尺度预测;(2)使用一系列3*3大小的卷积核得到相对于先验框的偏移和类别分数(YOLO用的全连接),每个m*n大小的feature map一共有(c+4)*k*m*n个输出,c是类别,k为每个box输出的框的个数;(3)端到端训练。2,训练(1)匹配策略首先给每个真实框匹配Io...原创 2020-08-09 10:31:15 · 684 阅读 · 0 评论 -
YOLO系列学习笔记
一,YOLO1,主要过程 1):将图片分成 S * S (论文中取7)个网格,若莫个对象中心坐落于一个网格内,则该网格负责检测该对象。 2):每个网格预测B个bounding boxes和其相应confidence,confidence可以理解为该框包含对象的概率乘以IoU。 3):每个bounding box预测5个值,x、y、w、h、confide...原创 2020-08-09 10:31:22 · 288 阅读 · 0 评论 -
Faster R-CNN学习笔记
回顾R-CNN系列: (1),R-CNN:生成候选框 + 对每个框进行分类回归的结构(生成region proposals + 提特征 + 多svm分类器 + bb回归); (2),Fast R-CNN:在feature map上生成候选框,使用RoIpooling以统一全连接层的输入(softmax分类回归,146倍);Faster R-CNN,贡献:提出RPN网络(...原创 2020-08-09 10:31:33 · 220 阅读 · 0 评论 -
KITTI结果评测流程
1,gt(真实框)存放在:data / object / label_2 / ??????.txt检测结果存放在: results / result_sha / data / ??????.txt输出结果路径:results / result_sha / plot /2,gt和检测结果格式: txt 格式,文件名6位数字,都从000000.txt按顺序命名,gt和检测结果一一...原创 2020-08-09 10:29:50 · 3728 阅读 · 13 评论