项目实训
OOFelvis
程序员
展开
-
自然场景文本区域检测之CTPN
CTPN是现在的主流自然场景文本区域检测模型中流传最广泛的模型之一,它可以同时检测水平或者稍微倾斜的自然场景下的文本。CTPN的全称为Connectionist Text Proposal Network,该模型在论文Detecting Text in Natural Image with Connectionist Text Proposal Network(ECCV2016)中...原创 2019-05-26 21:50:36 · 1178 阅读 · 0 评论 -
深度学习linux服务器中docker的常用指令及部分技巧
深度学习linux服务器中docker的常用指令及部分技巧Docker中的几个核心概念Docker中常用指令可能遇到的问题:后台运行深度学习模型小技巧在日常的深度学习模型训练过程中,我们可能难免要使用到远程高性能的linux服务器,而大部分公用服务器又不能随意修改系统环境参数,这时候懂得使用docker就显得十分重要了.Docker 是一个开源项目,诞生于 2013 年初,最初是 dotClo...原创 2019-05-27 12:54:42 · 450 阅读 · 0 评论 -
Keras框架安装及入门
简介Keras 是一个用 Python 编写的高级神经网络 API,它能够以 TensorFlow, CNTK, 或者 Theano 作为后端运行。Keras 的开发重点是支持快速的实验。为什么选择Keras1.Keras 被工业界和学术界广泛采用2.Keras 模型可以轻松部署在更广泛的平台3.Keras 支持多个后端引擎4.Keras 拥有强大的多 GPU 和分布式训练支持5....原创 2019-05-27 19:40:14 · 14005 阅读 · 0 评论 -
双向长短时记忆循环神经网络
LSTM传统的循环神经网络(RNN)能够得到的上下文信息范围很有限。这个问题就使得隐含层的输入对于网络输出的影响随着网络环路的不断递归而衰退。为了解决这个问题,长短时记忆(LSTM)结构诞生了。与其说长短时记忆是一种循环神经网络,倒不如说是一个加强版的组件被放在了循环神经网络中。LSTM单元能够很好的解决跨时间记忆以及梯度消失的问题。LSTM结构的形式化定义如下:LSTM时刻j的状态由两...原创 2019-05-27 21:02:16 · 5503 阅读 · 0 评论 -
CTC介绍
OCR文字识别主要包括2个步骤:文字检测:解决的问题是哪里有文字,大致的文本行区域文字识别:对定位好的文字区域进行识别,主要解决的问题是每个文字是什么文字检测可以使用我之前博客介绍的CTPN模型。现有的常见的端到端文字识别框架有以下两种:1.CNN+RNN+CTC2.CNN+Seq2Seq+Attension机制CTCCTC的全称为Connectionist Temporal Cl...原创 2019-05-27 21:50:15 · 3266 阅读 · 0 评论 -
DenseNet简介
论文传送门:https://arxiv.org/pdf/1608.06993.pdfCNN模型的发展十分火热,自LeNet提出以来,涌现了一批优秀的CNN模型。LeNet是CNN的开山之作,标志着CNN真正的提出。2012年AlexNet夺得ILSVRC2012的冠军,深度学习大火。之后又涌现了VGG、GoogleNet、ResNet等,其中ResNet可谓是一个里程碑式的CNN模型。本文介...原创 2019-05-30 18:09:23 · 1241 阅读 · 0 评论 -
VGG网络
论文传送门:https://arxiv.org/pdf/1409.1556.pdfVGG网络是十分经典的CNN网络模型,在特征提取和迁移学习任务中都经常被使用。其中使用最广泛的是VGG16和VGG19,分别代表网络层级为16层和19层。VGG在文章《Very deep convolutional networks for large-scale image recognition》中提出,为了...原创 2019-06-02 14:46:04 · 4755 阅读 · 0 评论