论文阅读笔记
文章平均质量分 80
极致 for 简单
贵在坚持
展开
-
fast rcnn
一、architecture利用ss算法提取待检测image的2k个proposals(ROIs);使用deep conv network提取整张image特征,将2k个ROIs逐一映射到到conv feature map;将其传入到ROI Pooling layer进行池化得到固定长度的feature vector;将其传入到多个fc layers,最终传入两个不同的分支,得到softmax ...原创 2020-03-02 23:44:48 · 136 阅读 · 0 评论 -
spp net
创新点:在深度网络中,引入空间金字塔池化来代替普通的池化层,对特征进行了进一步的汇聚,无论对何种input image,计算合适的金字塔的window size(feature map size/ number of block 上取样)和stride(feature map size/ number of block 下取样),都可得到固定维度的特征以输入到全连接层。空间池化层改善了:测试...原创 2020-02-28 21:35:35 · 243 阅读 · 0 评论 -
network in network
1、mlp convolutionlocal patch 只采取传统卷积操作,属于线性操作,无法提取出非线性特征。多层感知机可拟合复杂函数。因此,将local patch提取的特征接入到多层感知机中,以提取出该local patch的隐藏特征。mlp中的神经元对应1*1的channel2、globe pooling layer以全局池化层取代全连接层,由于对local patch提取的...原创 2020-02-19 19:51:23 · 216 阅读 · 0 评论 -
GoogLeNet
介绍:相较于简单暴力的提高深度网络性能方法:加深网络模型,增加数据集。作者提出结合深度模型和传统机器视觉思想来提高效能。(准确率+效率,特别适合用于移动端或是嵌入式,计算能力有限,为解决这一问题,可从减少参数入手)base:赫布理论、多尺度、稀疏结构、network in network(下一篇阅读)相关工作:1、池化有益于准确率的提升2、多滤波器模拟多尺度的学习3、network i...原创 2020-02-17 16:56:12 · 129 阅读 · 0 评论 -
Vgg-net学习笔记
ConvNet架构1、input image is 224224 ,对每个像素减去平均值(训练集上)2、small receptive region,33 filter size,多个small filter 的堆积,相当于一个大的感知域,但是使用小的感知域filter的堆积,能够引入更多的非线性,同时参数较大的感知域的filter来说更少,相当于做了正则化。stride为1。3、5个池化层...原创 2020-02-11 19:03:45 · 251 阅读 · 0 评论