场景文字识别综述

最新推荐文章于 2023-02-16 18:37:20 发布

xyz2107605729

最新推荐文章于 2023-02-16 18:37:20 发布

阅读量3.7k

点赞数

分类专栏：深度学习文章标签： scene text

场景文字检测和识别的关键技术

网络架构

全卷积网络 FCN

Fully convolutional network FCN 全卷积网络，没有全连接层的网络
FCN可以生成用于有效语义分割的特征层次结构
由于多尺寸学习和预测的优点，符合场景文字的本质，许多文字识别方法把FCN作为它们的骨干（backbone）网络。
一般来说，首先，使用 FCN 得到像素级文本/非文本 salient map（突出点映射），它产生像素级标签或包含文本的标记区域。然后，生成文本候选边框。
通过利用 skip architecture of FCN（全连接网络的跳跃连接结构），不同尺寸的感受野（receptive fields RF）能够同时编码文本的局部特征和文本的全局上下文信息。

ResNet

越深的神经网络越难训练，因为精度可能饱和并且迅速下降，参数跟新比较困难
为了解决深层网络难训练的问题，提出了deep residual network（深度残差网络 ResNet），它的组成模块被定义为

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
2
评论
场景文字识别综述

场景文字检测和识别的关键技术网络架构全卷积网络 FCNFully convolutional network FCN 全卷积网络，没有全连接层的网络FCN可以生成用于有效语义分割的特征层次结构由于多尺寸学习和预测的优点，符合场景文字的本质，许多文字识别方法把FCN作为它们的骨干（backbone）网络。一般来说，首先，使用 FCN 得到像素级文本/非文本 salient map（突...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。