Sequence-to-sequence Domain Adaptation Network for Robust Text Image Recognition笔记

简介

  Domain adaptation 可以解决不同域之间的偏移的问题。之前大多数的工作都没有考虑连续序列的问题,都是对于单一内容的。这篇文章中,作者提出了一个SSDAN的网络来做文本识别。其中的gateed attention similarity用来将源域和目标域的字符特征分布来对齐。对文本识别带来提升。

domain adaptation的好处

  如何训练一个鲁棒的识别器能够很好地识别所有类型的字体?最直接的方法是使用所有类型的数据集来训练,拟合出一个很好地网络。但是数据集的标注需要巨大的消费,因此,如何无监督地使用数据集是一个很好地方法。使用domain adaptation是一个很好的使用无标注数据集的方法来减少源域和目标域的分布偏差。这样就能够使得之前使用有标注的数据集训练好的模型泛化到无标注的数据集上,解决了不同域之间的偏移问题。

实现的方法

文本识别模块

  通过cnn网络输出H*W*C的特征图。把通道维度的特征作为1维的 vector,H和w相乘的值作为序列的总数。这个序列输入lstm做attention,将求出的attention的值与原序列相乘得到一个字符的context vector。之后通过一个GRU来做decoder。下一个时刻的隐藏层利用了前一时刻隐藏层,输出层,和当前字符的context vector。

GAS模块

  通过前面的encoder和decoder的模块,我们可以将字符串转换为一个字符特征序列。在字符序列特征的空间中,不同域提取出来的特征应该尽可能的靠近。这样就可以减少两个域特征空间之间的距离。两个域的图片得分别得到字符的特征序列。这时,出现了一个问题:如果attenti

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值