文本检测
detec
wyl2077
这个作者很懒,什么都没留下…
展开
-
FOTS(1)基础网络
ResNetpaper:https://arxiv.org/pdf/1512.03385.pdfResNet(深度残差网络)提出于2015年,有效的解决了当网络层数增加导致的梯度消失和梯度爆炸问题(如下图所示):文中提出了如下网络结构:在原本的网络结构上引入右侧的x,这样网络的输出变为H(X)=F(X)+X,当网络层数太深时,若F(X),那么H(X)=X,也就可以将深层网络看成浅层网络。为什么我们要利用残差网络来制造恒等映射呢,当网络深度增加时,如果新增加的网络什么都不做,模型的效果也不至于下降原创 2020-11-11 16:28:58 · 456 阅读 · 0 评论 -
CTPN实战(1)NET
CTPN的NET的pytorch实现原创 2020-10-13 20:52:11 · 239 阅读 · 1 评论 -
CTPN实战(2)LOSS
基础知识机器学习可以理解为对目标函数的最大化或最小化过程,而需要最小化的目标函数称为损失函数。1.1针对分类问题和回归问题,有不同的损失函数,首先简单介绍回归问题常用的损失函数,1.1.1均方误差(MSE):均方误差是回归损失函数中最常用的误差,它是预测值与目标值之间差值的平方和,也叫L2范数损失函数,y为真实值,f(xi)为预测值,其公式如下所示:1.1.2平均绝对误差指的是误差的距离的平均值,是一种L1范数误差,其表达式为:1.1.3 SmoothL1Loss:x为真实值和预测值原创 2020-10-25 18:57:10 · 598 阅读 · 0 评论 -
OCR常用数据集
ocr数据集介绍版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.csdn.net/qq_33511693/article/details/105316987转载 2020-10-21 16:22:43 · 365 阅读 · 0 评论 -
OCR学习(2)CTPN学习
OCR学习(2)CTPN学习CTPN(Connectionist Text Proposal Network)是一种文本检测算法(text detection),论文发表于2016年,是一种anchor-based算法,基于Faster-rcnn,是利用深度学习进行文本检测的经典算法之一,适用横向文本的检测。论文阅读论文原文:https://arxiv.org/pdf/1609.03605.pdf1.网络结构:首先利用VGG16(CNN)提取特征,选取conv5作为feature map。之后在原创 2020-09-02 16:59:50 · 217 阅读 · 0 评论 -
OCR学习笔记(3)tesseract学习
OCR学习笔记(3)tesseract学习tesseract介绍Tesseract 是由惠普发布后谷歌维护的开源文字识别项目,从 Tesseract v4 开始宣布支持 深度神经网络 LSTM 进行文字识别。win10下tessercat安装(0)我的python版本为3.6.5(1)下载地址:https://digi.bib.uni-mannheim.de/tesseract/我选择的版本是:这里的版本需要与之后安装的tessorocr或pytesseract对应。安装时不要勾选downl原创 2020-08-31 22:52:31 · 263 阅读 · 0 评论