深度学习
abc8350712
这个作者很懒,什么都没留下…
展开
-
深度学习细节备忘录
SPP-net:输入整张图片,特征从共享feature map上提取,所以大大加快了速度原创 2017-02-26 17:14:21 · 347 阅读 · 0 评论 -
Fast RCNN
基本网络:输入为224x224的图片大小,输出为(k+1)x4的的回归坐标以及k+1的类别概率对于原始图片,利用selective search等算法提取候选框,归一化至固定大小。 对于训练样本,输入即可训练出网络 对于测试样本,输入即可得出所要的类别值及其加归坐标偏移值原创 2017-06-12 15:16:24 · 201 阅读 · 0 评论 -
FAST-RCNN 和 Faster-RCNN
上面是Fast-RCNN的基本流程输入有两部分:1)原图。2)Selective Search Fast-RCNN相比RCNN的优点就在于,只经过一次的前向传播,共享Feature Map,大大加快了速度。 对于各个Region Proposal,我的理解是,从Feature Map里找到相应的区域,再把该输入值投放到ROI Pooling当中,生成一样大小的Feature Vector。最后利原创 2017-08-10 23:16:22 · 502 阅读 · 0 评论 -
FPN网络
FPN (a)对图片进行上采样,分别对不同尺度的图片进行预测,这是以前的方法 (b)仅用最后一层作为预测,比如Faster-RCNN (c)多层Feature Map 预测整合产生最终结果,比如SSD (d)Feature Map与上层经过上采样的特征图相加形成亲的Feature map用来预测那么如何用(d)来代替(b)再结合Fast-RCNN呢回忆一下Faster-RCNN是个怎么样原创 2017-08-17 16:04:09 · 4284 阅读 · 1 评论 -
Seglink代码之ICDAR2015_to_tfrecords
关键性代码在于 convert_to_example。比较重要的数据有: 1)GT的八个点 2)GT的四个点 3)imagedef convert_to_example(image_data, filename, labels, ignored, labels_text, bboxes, oriented_bboxes, shape): """Build an Example prot原创 2017-10-24 16:30:34 · 1330 阅读 · 0 评论