![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉学习笔记
文章平均质量分 93
Missayaa
我要去百度百度百度!!!
展开
-
计算机视觉杂记(1)
计算机视觉一:计算机视觉领域暂存的比较难以解决的问题:1、对照片的密集标记2、将识别问题和标记问题整合3、动作场景的识别4、计算机视觉的愿景是至少让计算机达到看图讲故事的水平二:K最近邻与线性分类器L1距离算法,也就是欧式距离矢量化FLANN实例库可采用交叉验证的方法来提高精度算法缺点:测试时过于耗费计算能力,准确率低三:一些Tips绝不能使用测试集来调优,测试集数据只能使用一次,即在训练完成后,评原创 2017-09-05 18:59:05 · 367 阅读 · 0 评论 -
caffe中各个层——解析
原文地址:http://www.cnblogs.com/denny402/p/5071126.html 所有的层都具有的参数,如name, type, bottom, top和transform_param请参看我的前一篇文章:Caffe学习系列(2):数据层及参数本文只讲解视觉层(Vision Layers)的参数,视觉层包括Convolution, Pooling, Local Res...转载 2018-08-02 15:15:00 · 1493 阅读 · 1 评论 -
RPN层解析
https://blog.csdn.net/sloanqin/article/details/51545125转载 2018-08-10 12:15:37 · 6556 阅读 · 4 评论 -
Faster RCNN
贴上两篇非常好的博客: https://blog.csdn.net/lanran2/article/details/54376126 https://blog.csdn.net/hunterlew/article/details/71075925 https://blog.csdn.net/g11d111/article/details/78823663...转载 2018-07-27 16:48:19 · 278 阅读 · 0 评论 -
自然场景文本处理论文整理 (5)Detecting Curve Text in the Wild: New Dataset and New Solution
paper:https://arxiv.org/abs/1712.02170 github:https://github.com/Yuliang-Liu/Curve-Text-Detector一、摘要 为了提出在野外阅读曲线文本的问题,在本文中,我们构建了一个名为CTW1500的曲线文本数据集,其中包括1,500个图像中的超过10k文本注释(1000个用于训练,500个用于测试)。基于该数...原创 2018-07-26 14:37:15 · 4932 阅读 · 0 评论 -
自然场景文本处理论文整理(1)Spatial Transformer Networks
paper:Spatial Transformer Networks 在Theano框架中,STN算法已经被封装成API,可以直接调用。tensorflow实现见文章最后。 1、空间变换器的结构: 这是一个可微分的模块,它在单个前向传递期间将空间变换应用于要素图,其中变换以特定输入为条件,从而生成单个输出要素图。对于多通道输入,对每个通道应用相同的扭曲。为简单起见,在本节中我们考虑每个变...原创 2018-07-20 11:03:10 · 819 阅读 · 0 评论 -
自然场景文本处理论文整理(2)STN-OCR
今天是进入公司实习的第三周了,在小组内负责的工作主要是和自然场景文本检测相关的内容。这里把看过的论文做一下翻译和整理,也方便自己日后查看。 Paper:STN-OCR: A single Neural Network for Text Detection and Text Recognition Github地址:https://github.com/Bartzi/stn-ocr摘要检...原创 2018-07-19 17:52:19 · 6300 阅读 · 1 评论 -
Fast R-CNN
这里贴上两篇讲解比较详细的文章,作为记录 https://blog.csdn.net/WoPawn/article/details/52463853?locationNum=5 https://blog.csdn.net/wonder233/article/details/53671018转载 2018-07-24 14:59:47 · 222 阅读 · 0 评论 -
自然场景文本处理论文整理 (4)PixelLink
摘要大多数最先进的场景文本检测算法是基于深度学习的方法,其依赖于边界框回归并且执行至少两种预测:文本/非文本分类和位置回归。回归在这些方法中获取边界框中起着关键作用,但它不是必不可少的,因为文本/非文本预测也可以被视为一种包含完整位置信息的语义分割。然而,场景图像中的文本实例通常彼此非常接近,使得它们很难通过语义分割来分离。因此,需要实例分割来解决此问题。本文提出了一种基于实例分割的新型场景文...原创 2018-07-23 17:23:34 · 3565 阅读 · 1 评论 -
自然场景文本处理论文整理(3)Mask TextSpotter
这篇论文是2018年7月6号出来的,对于任意形状的自然文本检测识别效果非常好。 paper:https://arxiv.org/abs/1807.02242 目前无相关源码1.摘要简介在本文中,我们提出了一个名为Mask TextSpotter的文本监视器,它可以检测和识别任意形状的文本实例。 这里,任意形状意味着现实世界中可能呈现的各种形式的文本实例。 受Mask R-CNN [9]...原创 2018-07-23 16:51:45 · 3136 阅读 · 1 评论 -
caffe源码理解之inner_product_layer
原文地址:https://www.cnblogs.com/dupuleng/articles/4312149.html 在caffe中所谓的Inner_Product(IP) 层即fully_connected (fc)layer,为什么叫ip呢,可能是为了看起来比较优雅吧。。 从CAFFE_ROOT/examples/mnist/lenet.prototxt中截取一段假设conv2的输入是2...转载 2018-08-02 15:52:08 · 497 阅读 · 0 评论