2018年05月_木瓜子

12月 10月 07月 06月 05月 04月

原创 ImageNet 近几年模型汇总

ImageNet Large-ScaleVisual Recognition Challenge (ILSVRC)用到的模型1.2012年，Hinton的学生Alex Krizhevsky提出了深度卷积神经网络模型AlexNet 2.2014年，牛津大学计算机视觉几何组Karen Simonyan和Google DeepMind公司的研究员Andrew Zisserman一起研发的深度卷积...

2018-05-31 21:22:18 3582

原创深度卷积神经网络VGG 学习笔记

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITIONAuthor：Karen Simonyan &amp; Andrew Zisserman Years:2014,Published as a conference paper at ICLR 20151.介绍VGGNet是2014年 ImageNet...

2018-05-31 20:41:54 6422

原创生成对抗网络GAN原理学习笔记

Generative Adversarial Nets1. GAN究竟在做什么？学习样本集的数据分布A.学习数据分布有什么用？（1）学习到高维抽象的分布函数（2）模拟预测未来数据（3）处理缺省数据问题：如半监督学习（4）生产真实样本建立模型，分析数据特征，还原数据，……B.如何生成真实样本？C.生成模型的一些常见方法：D.生成模...

2018-05-30 21:12:03 900

原创 Chinese Text in the Wild 学习笔记

Chinese Text in the Wild1. 介绍在本文中，我们用自然图像中包含的文字创建了一个大型数据集，名为Chinese Text in the Wild（CTW）。该数据集包含32,285张带有1,018,402个中文字符的图像，远远超出了之前的数据集，这些图片来自腾讯街景，从中国数十个不同的城市获取，没有任何特殊目的。由于其多样性和复杂性，该数据库存在极大的挑战性。...

2018-05-30 15:44:17 3145

转载 Connectionist temporal classification（CTC）简介

背景Connectionist temporal classification简称CTC，翻译不太清楚，可以理解为基于神经网络的时序类分类。其中classification比较好理解，表示分类问题；temporal可以理解为时序类问题，比如语音识别的一帧数据，很难给出一个label，但是几十帧数据就容易判断出对应的发音label，这个词也给出CTC最核心的...

2018-05-30 10:35:50 5222

原创 Implicit Language Model in LSTM for OCR 学习笔记

Implicit Language Model in LSTM for OCR1.介绍在本文中，我们试图改进对LSTMs的科学理解，特别是语言模型和LSTM中存在的字形模型之间的相互作用。我们称这种内部语言模型为隐式语言模型（隐式LM）。本文的贡献：1）在受控条件下建立隐式LM的存在; 2）通过找出它使用的上下文有多少个字符来描述隐式LM的本质。我们所描述的隐式LM与上面讨论的文...

2018-05-29 16:01:59 782

SRCNN模型代码 pytorch版本

《Learning a Deep Convolutional Network for Image Super-Resolution》SRCNN模型代码，pytorch版本的，只包括模型代码，没有数据预处理等

2020-08-06

吴福朝编写的本书由射影几何、矩阵与张量、模型估计三个部分组成，它们是三维计算机视觉所涉及到的基本数学理论与方法。I. 射影几何学是三维计算机视觉的数学理论基础，是从事计算机视觉研究所必备的数学知识。本书着重介绍射影几何学和它在视觉中的应用，主要内容包括：平面与空间射影几何，摄像机几何，两视点几何，自标定技术和三维重构理论。II. 矩阵与张量是描述和解决计算机视觉问题的必要数学工具，视觉领域研究人员都应该掌握这门数学。本书着重介绍与视觉有关的矩阵、张量理论与它的应用，主要内容包括：矩阵分解，矩阵分析，张量代数，运动与结构，多视点张量。III. 模型估计是三维计算机视觉的基本问题，通常涉及到变换或某种数学量的估计。本书着重介绍与视觉估计有关的数学理论与方法，主要内容包括：迭代优化理论，参数估计理论，视觉估计的代数方法、几何方法、鲁棒方法和贝叶斯方法。上述三部分涉及的数学内容是相对独立的，但三维计算机视觉将它们组成一个有机的整体。通过阅读本书，读者能掌握三维计算机视觉中的基本数学内容与方法，增强数学素养、提高分析和解决视觉问题的数学能力。

2018-08-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

木瓜子的博客

原创 ImageNet 近几年模型汇总

原创深度卷积神经网络VGG 学习笔记

原创生成对抗网络GAN原理学习笔记

原创 Chinese Text in the Wild 学习笔记

转载 Connectionist temporal classification（CTC）简介

原创 Implicit Language Model in LSTM for OCR 学习笔记

SRCNN模型代码 pytorch版本

计算机视觉中的数学方法

OpenCV3计算机视觉 Python语言实现

基于卷积神经网络的手写数字识别

数字图像处理Matlab第二版图片资源

空空如也

原创 ImageNet 近几年模型汇总

原创 深度卷积神经网络VGG 学习笔记

原创 生成对抗网络GAN原理 学习笔记

原创 Chinese Text in the Wild 学习笔记

转载 Connectionist temporal classification（CTC）简介

原创 Implicit Language Model in LSTM for OCR 学习笔记

SRCNN模型代码 pytorch版本

计算机视觉中的数学方法

OpenCV3计算机视觉 Python语言实现

基于卷积神经网络的手写数字识别

数字图像处理Matlab第二版图片资源

空空如也

原创深度卷积神经网络VGG 学习笔记

原创生成对抗网络GAN原理学习笔记