论文阅读
文章平均质量分 79
Ayu___
这个作者很懒,什么都没留下…
展开
-
R-CNN or SPP-net
词袋(Bag-of-Words, BoW)模型 空间金字塔池化层:将特征图以空间块的形式进行分块,这些空间块的尺寸和图像的尺寸是成比例的,这样块的数量就是固定的了,如下图就有16+4+1个空间块,每个块提取出一个特征,这样刚好就是我们要提取的21维特征向量。经过这一层,输出向量大小为Mk,M=#bins(块数), k=#filters(卷积核个数),作为全连接层的输入。这样,全连接层的输入尺寸就固定了。而深度网络的滑窗池化(sliding window pooling)则对依赖于输入图像的尺寸。 ...原创 2021-01-23 11:55:32 · 208 阅读 · 0 评论 -
阅读论文--yolov1
Abstract 1.将目标检测当做回归问题,去预测空间分离的边界框和相关类别概率。 2.单个神经网络从整个图片中一次性预测边界框和类别概率,可以端到端的进行优化 1.Introduction 特点 1.速度很快,因为目标检测当做回归问题,所以不需要复杂的管线。 45 frames per second with no batch processing on a Titan XGPU 2.YOLO在进行预测时,会对图像进行全局推理。在训练和测试时,YOLO会隐含地编码了关于类的上下文信息和外观,降低了背景误原创 2020-12-21 15:34:09 · 132 阅读 · 0 评论