自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

木瓜子的博客

瓜子,你作业写完了吗

  • 博客(6)
  • 资源 (5)
  • 收藏
  • 关注

原创 ImageNet 近几年模型汇总

ImageNet Large-ScaleVisual Recognition Challenge (ILSVRC)用到的模型1.2012年,Hinton的学生Alex Krizhevsky提出了深度卷积神经网络模型AlexNet 2.2014年,牛津大学计算机视觉几何组Karen Simonyan和Google DeepMind公司的研究员Andrew Zisserman一起研发的深度卷积...

2018-05-31 21:22:18 3582

原创 深度卷积神经网络VGG 学习笔记

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITIONAuthor:Karen Simonyan & Andrew Zisserman Years:2014,Published as a conference paper at ICLR 20151.介绍VGGNet是2014年 ImageNet...

2018-05-31 20:41:54 6422

原创 生成对抗网络GAN原理 学习笔记

Generative Adversarial Nets1. GAN究竟在做什么?学习样本集的数据分布A.学习数据分布有什么用?(1) 学习到高维抽象的分布函数 (2) 模拟预测未来数据 (3) 处理缺省数据问题:如半监督学习 (4) 生产真实样本 建立模型,分析数据特征,还原数据,……B.如何生成真实样本?C.生成模型的一些常见方法:D.生成模...

2018-05-30 21:12:03 900

原创 Chinese Text in the Wild 学习笔记

Chinese Text in the Wild1. 介绍在本文中,我们用自然图像中包含的文字创建了一个大型数据集,名为Chinese Text in the Wild(CTW)。该数据集包含32,285张带有1,018,402个中文字符的图像,远远超出了之前的数据集,这些图片来自腾讯街景,从中国数十个不同的城市获取,没有任何特殊目的。由于其多样性和复杂性,该数据库存在极大的挑战性。...

2018-05-30 15:44:17 3145

转载 Connectionist temporal classification(CTC)简介

背景Connectionist temporal classification简称CTC,翻译不太清楚,可以理解为基于神经网络的时序类分类。其中classification比较好理解,表示分类问题;temporal可以理解为时序类问题,比如语音识别的一帧数据,很难给出一个label,但是几十帧数据就容易判断出对应的发音label,这个词也给出CTC最核心的...

2018-05-30 10:35:50 5222

原创 Implicit Language Model in LSTM for OCR 学习笔记

Implicit Language Model in LSTM for OCR1.介绍在本文中,我们试图改进对LSTMs的科学理解,特别是语言模型和LSTM中存在的字形模型之间的相互作用。 我们称这种内部语言模型为隐式语言模型(隐式LM)。 本文的贡献:1)在受控条件下建立隐式LM的存在; 2)通过找出它使用的上下文有多少个字符来描述隐式LM的本质。 我们所描述的隐式LM与上面讨论的文...

2018-05-29 16:01:59 782

SRCNN模型代码 pytorch版本

《Learning a Deep Convolutional Network for Image Super-Resolution》SRCNN模型代码,pytorch版本的,只包括模型代码,没有数据预处理等

2020-08-06

计算机视觉中的数学方法

吴福朝编写的 本书由射影几何、矩阵与张量、模型估计三个部分组成,它们是三维计算机视觉所涉及到 的基本数学理论与方法。I. 射影几何学是三维计算机视觉的数学理论基础,是从事计算机视觉研究所必备的数学知识。本书着重介绍射影几何学和它在视觉中的应用,主要内容包括:平面 与空间射影几何,摄像机几何,两视点几何,自标定技术和三维重构理论。II. 矩阵与张量是描述和解决计算机视觉问题的必要数学工具,视觉领域研究人员都应该掌握这门数学。本书着重介绍与视觉有关的矩阵、张量理论与它的应用,主要内容包括:矩阵分解,矩阵分析,张量代 数,运动与结构,多视点张量。III. 模型估计是三维计算机视觉的基本问题,通常涉及到变换或某种数学量的估计。本书着重介绍与视觉估计有关的数学理论与方法,主要内容包括:迭代优化理论,参数估计理论,视觉估计的代数方法、几何方法、鲁棒方法和贝叶斯方法。上述三部分涉及的数学内容是相对独立的,但三维计算机视觉将它们组成一个有机的整体。通过阅读本书,读者能掌握三维计算机视觉中的基本数学内容与方法,增强数学素养、提高分析和解决视 觉问题的数学能力。

2018-08-10

OpenCV3计算机视觉 Python语言实现

基于python语言的OpenCV学习手册,用于计算机视觉方面的,有需要的同学可以自行下载!

2018-08-10

基于卷积神经网络的手写数字识别

最简单、最基本的卷积神经网络用于手写体的数字识别,数据集是MINST,框架是pytorch,代码及注释都写的非常清楚!

2018-06-16

数字图像处理Matlab第二版图片资源

数字图像处理Matlab第二版书中的配套资源,需要的筒子们可以自行下载!

2017-12-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除