- 博客(6)
- 资源 (5)
- 收藏
- 关注
原创 ImageNet 近几年模型汇总
ImageNet Large-ScaleVisual Recognition Challenge (ILSVRC)用到的模型1.2012年,Hinton的学生Alex Krizhevsky提出了深度卷积神经网络模型AlexNet 2.2014年,牛津大学计算机视觉几何组Karen Simonyan和Google DeepMind公司的研究员Andrew Zisserman一起研发的深度卷积...
2018-05-31 21:22:18 3582
原创 深度卷积神经网络VGG 学习笔记
VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITIONAuthor:Karen Simonyan & Andrew Zisserman Years:2014,Published as a conference paper at ICLR 20151.介绍VGGNet是2014年 ImageNet...
2018-05-31 20:41:54 6422
原创 生成对抗网络GAN原理 学习笔记
Generative Adversarial Nets1. GAN究竟在做什么?学习样本集的数据分布A.学习数据分布有什么用?(1) 学习到高维抽象的分布函数 (2) 模拟预测未来数据 (3) 处理缺省数据问题:如半监督学习 (4) 生产真实样本 建立模型,分析数据特征,还原数据,……B.如何生成真实样本?C.生成模型的一些常见方法:D.生成模...
2018-05-30 21:12:03 900
原创 Chinese Text in the Wild 学习笔记
Chinese Text in the Wild1. 介绍在本文中,我们用自然图像中包含的文字创建了一个大型数据集,名为Chinese Text in the Wild(CTW)。该数据集包含32,285张带有1,018,402个中文字符的图像,远远超出了之前的数据集,这些图片来自腾讯街景,从中国数十个不同的城市获取,没有任何特殊目的。由于其多样性和复杂性,该数据库存在极大的挑战性。...
2018-05-30 15:44:17 3145
转载 Connectionist temporal classification(CTC)简介
背景Connectionist temporal classification简称CTC,翻译不太清楚,可以理解为基于神经网络的时序类分类。其中classification比较好理解,表示分类问题;temporal可以理解为时序类问题,比如语音识别的一帧数据,很难给出一个label,但是几十帧数据就容易判断出对应的发音label,这个词也给出CTC最核心的...
2018-05-30 10:35:50 5222
原创 Implicit Language Model in LSTM for OCR 学习笔记
Implicit Language Model in LSTM for OCR1.介绍在本文中,我们试图改进对LSTMs的科学理解,特别是语言模型和LSTM中存在的字形模型之间的相互作用。 我们称这种内部语言模型为隐式语言模型(隐式LM)。 本文的贡献:1)在受控条件下建立隐式LM的存在; 2)通过找出它使用的上下文有多少个字符来描述隐式LM的本质。 我们所描述的隐式LM与上面讨论的文...
2018-05-29 16:01:59 782
SRCNN模型代码 pytorch版本
2020-08-06
计算机视觉中的数学方法
2018-08-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人