CNN
文章平均质量分 83
alibabazhouyu
这个作者很懒,什么都没留下…
展开
-
A Simple Semi-Supervised Learning Framework for Object Detection
热门的半监督学习方法大部分是基于一致性自训练的。半监督的核心思想是先为无标注的数据生成人工标签,然后训练模型预测这些人工标签。预测的人工标签可以是one-hot也可以是预测分布(soft)。SSL成功的另一个支柱是数据增强的进步。数据增强提高了深度神经网络的鲁棒性。并且已经证明对于基于一致性的自训练特别有效。复杂的数据增强策略,例如RandAugment 和CTAugment ,对SSL的图像分类非常有效。用于对象检测的SSL仅有的研究大多依赖于额外的上下文,例如对象的类别相似性。本来利用从图像分类中学到的原创 2020-12-10 02:47:17 · 2221 阅读 · 0 评论 -
一些库的使用
1.rect = cv2.minAreaRect(bboxes[j]) # (points)bbox = cv2.boxPoints(rect)bbox = bbox.astype('int32')bbox = Polygon(bbox).convex_hullprint(list(bbox.exterior.coords)) #输出Polygon对象的坐标原创 2020-12-03 14:10:41 · 190 阅读 · 0 评论 -
python3切换到python2
查看Python默认版本终端输入:python --version我需要修改为Python2.7.12,步骤如下1)echo alias python=python2 >> ~/.bashrc 2)source ~/.bashrcpython --version此时输出python2.7.12再安装pip2wget https://pypi.python.org/packages/11/b6/abcb525026a4be042b486df43905d68...原创 2020-07-26 19:24:49 · 2437 阅读 · 0 评论 -
CVPR2020文章核心思想总结
PolarMask: Single Shot Instance Segmentation with Polar Representation 核心思想:通过实例中心区域(质心周围的9-16个像素为正样本,而不仅仅是质心被当作正样本,这能增加正样本的数量,而且有时候质心可能并不是最佳点,增加一些点能增大选择到最佳点的概率)分类和在极坐标中密集地回归距离来预测实例轮廓。为此,提出了两种有效的方法(极化中心和极化IoU loss)来分别处理高质量中心样本的采样和优化密集距离回归,这可以显着提高性能并简化训练过程原创 2020-05-30 14:49:55 · 419 阅读 · 0 评论 -
GoogLeNet理解
GoogLeNet在ILSSVRC2014的分类和检测上去的了很好成绩。这个网络的主要特点是提高了网络内部的计算资源的利用率,能在保持现有计算预算不变的情况下增加网络的深度和宽度。近年来用于分类和检测的深度网络模型的性能提升主要是由于新想法、算法和改进的网络架构。目前的目标检测表现最好的是R-CNN,它是通过使用深度学习网络与传统的计算机视觉相结合的。本文提出的<Going Deeper w...原创 2018-04-15 21:52:20 · 964 阅读 · 0 评论 -
2017-2018高水平的文本检测识别文章
2017-2018论文更新识别 XiangBai——【PAMI2018】ASTER_An Attentional Scene Text Recognizer with Flexible Rectification Zhanzhan Cheng——【CVPR2018】AON_Towards Arbitrarily-Oriented Text Recognition Zh...原创 2018-09-24 12:33:23 · 3770 阅读 · 0 评论 -
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification Baoguang Shi, Mingkun Yang, Xinggang Wang, Pengyuan Lyu, Cong ...原创 2018-09-21 01:07:46 · 4570 阅读 · 0 评论 -
An end-to-end TextSpotter with Explicit Alignment and Attention
An end-to-end TextSpotter with Explicit Alignment and Attention Tong He;, Zhi Tian;, Weilin Huang, Chunhua Shen ...原创 2018-09-28 11:26:48 · 602 阅读 · 0 评论 -
Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework
Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework 结果:state-of-the-art accuracy in the end-to-end text recognition on two sta...原创 2018-11-15 21:41:34 · 835 阅读 · 0 评论 -
PixelLink: Detecting Scene Text via Instance Segmentation
浙江大学&阿里巴巴研究院&中科院 场景文本检测目前最好的场景文本检测算法中大部分是依赖于文本/非文本分类和位置回归,而且回归在获取边框中扮演关键的角色,但是并不是必不可少的,因为文本/非文本的预测也可以看作是一种包含所有位置信息的语义分割,但是文本实例距离太近,使用语义分割不太容易分隔开,所以使用实例分割。优点...原创 2019-01-22 22:36:23 · 568 阅读 · 0 评论 -
Geometry-Aware Scene Text Detection with Instance Transformation Network
很多场景文本检测方法是基于一般的目标检测框架。MSRA-D500的训练集太少了,不能很好地训练一个深度模型。通常的做法是把MSRA-TD500的训练集和其他数据混合一起训练,如HUST-TR400的训练集和测试集。检测结果的得分超过0.9的视为最终结果?本文是一个one-stage的方法 ...原创 2019-02-15 21:29:10 · 466 阅读 · 0 评论 -
Feature Enhancement Network: A Refined Scene Text Detector
问题1、怎么进行特征增强?。。。。高维度的语义信息利于目标分类,而低维度的语义信息利于对目标进行精确定位?用3x3的滑窗做region proposal以及在高维度用单一尺度做检测微调是不够的。FEN:任务特定,低维和高维语义特征融合,从而提高文本检测性能。adaptively weighted position-sensitive RoI pooling layer:进一步提高检...原创 2019-02-14 00:44:26 · 267 阅读 · 0 评论 -
python3输出中文乱码的问题
大部分是由于print()导致的解决办法:在运行的Python文件中添加如下代码即可import ioimport syssys.stdout = io.TextIOWrapper(sys.stdout.detach(),encoding='utf-8')原创 2019-03-02 00:53:06 · 3173 阅读 · 0 评论 -
知识获取
1、空洞卷积Dilated /Atrous convolution: 空洞卷积诞生于图像分割领域,图像输入到网络中经过CNNCNN提取特征,再经过poolingpooling降低图像尺度的同时增大感受野。由于图像分割是pixel−wisepixel−wise预测输出,所以还需要通过upsampling将变小的图像恢复到原始大小。图像分割FCNFCN有两个关键步骤:池化操作增大感受野,upsamp...原创 2019-04-05 17:20:29 · 1160 阅读 · 0 评论 -
安装mxnet+warp-ctc
在容器下:apt-get install -y libopenblas-devapt-get install -y libopencv-dev从 https://archive.apache.org/dist/incubator/mxnet/1.0.0/apache-mxnet-src-1.0.0-incubating.tar.gz 下载1.0.0mxnet,解压,cd mxnet...原创 2019-04-05 23:03:05 · 700 阅读 · 0 评论 -
PPTs
1、2019.4.9 Shape Robust Text Detection with Progressive Scale Expansion Network(即PSENet) 单位: DeepInsight@PCALab, Nanjing University of Science and Technology National Key Lab for Nove...原创 2019-04-09 16:52:12 · 1043 阅读 · 0 评论 -
问题解决
1、python2 要输出中文的时候出现编码错误UnicodeEncodeError: 'ascii' codec can't encode characters in position 4-33: ordinal not in range(128,则export PYTHONIOENCODING=utf8。2、明明GPU足够,却还报错说显存不足:RuntimeError: CUDA ou...原创 2019-04-26 02:13:37 · 414 阅读 · 0 评论 -
Deep TextSpotter: An End-to-End Trainable Scene Text Localization and Recognition Framework
效果:1、在ICDAR 2013 and ICDAR 2015的端到端识别中达到当时最好的精度2、速度很快,检测+识别可达到10FPS.本文特点:是端到端的框架,同时检测和识别文本贡献:1、在单个框架中训练文本检测和文本识别,并证明了它的效果优于把两个最优的文本检测网络和文本识别网络相结合的方法2、证明了最先进的目标检测方法可以用于扩展到文本检测和文本识别中3、在I...原创 2019-04-28 01:24:11 · 520 阅读 · 0 评论 -
Seq2Seq Attention模型
seq2seq 是一个Encoder–Decoder 结构的网络,它的输入是一个序列,输出也是一个序列, Encoder 中将一个可变长度的信号序列变为固定长度的向量表达,Decoder 将这个固定长度的向量变成可变长度的目标的信号序列。(seq2seq实现的方法有很多,比如MLP,CNN,RNN等)编码器: 可变长度的输入序列------------->固定长度的向量解码器: 固定...转载 2019-04-23 09:54:24 · 1186 阅读 · 0 评论 -
Synthetic MLT Data
([Arabic](http://ptak.felk.cvut.cz/public_datasets/SyntText/Arabic.zip),[Bangla](http://ptak.felk.cvut.cz/public_datasets/SyntText/Bangla.zip),[Chinese](http://ptak.felk.cvut.cz/public_datasets/Sy...原创 2019-04-19 15:10:09 · 460 阅读 · 0 评论 -
感受野的计算方式
原创 2019-05-10 15:56:59 · 375 阅读 · 0 评论 -
ctc和attention-based解码器的比较
Attention是一种权重向量或矩阵,其往往用在Encoder-Decoder架构中,其权重越大,表示的context对输出越重要。计算方式有很多亚种,但是核心都是通过神经网络学习而得到对应的权重。Attention模型虽然好,但是还是有自身的问题[4][5],问题如下:1)适合短语识别,对长句子识别比较差2)noisy data的时候训练不稳定因此比较好的方法是使得Attent...原创 2019-06-28 09:59:37 · 4898 阅读 · 0 评论 -
warp-ctc绑定pytorch出错解决办法
This should get you covered (tested with Ubuntu 16.04):sudo apt-get update -y# install python3 and dev headerssudo apt-get install -y python3 python3-dev# pip is greatsudo apt-get install -y ...原创 2019-07-01 01:09:22 · 952 阅读 · 0 评论 -
TextCohesion: Detecting Text for Arbitrary Shapes
TextCohesion: Detecting Text for Arbitrary Shapes 浙...原创 2019-09-18 21:46:12 · 543 阅读 · 0 评论