GA-DAN: Geometry-Aware Domain Adaptation Network for Scene Text Detection and Recognition

最新推荐文章于 2021-06-18 09:32:50 发布

nuonuo_orz

最新推荐文章于 2021-06-18 09:32:50 发布

阅读量721

点赞数 1

分类专栏：文字识别 GAN

本文链接：https://blog.csdn.net/nuonuo_orz/article/details/97977547

版权

GAN 同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

文字识别

0 篇文章 0 订阅

订阅专栏

贡献

在cycleGAN基础上做的改进
设计了一个网络，首次同时在geometry and appearance spaces做domain shifts
设计了multi-modal spatial 学习机制，引入一个spatial transformation discriminator，在几何空间实现multi-modal adaptation
设计了一个cycle-consistency loss，用于geometry 和 appearance space

GA-DAN架构

在这里插入图片描述
蓝色为spatial module
绿色为生成器
橙色为鉴别器

spatial module

包含spatial code、transformation module $T$ 和 localization network $LN_{X}$ 和 $LN_{Y}$ ，用来预测一个transformation矩阵，来对输入图像做几何转换，

生成器

用来补全背景和translate the image style

实验

文字检测

在这里插入图片描述
AD-IC13表示用IC13数据集和目标数据集的训练集做adaption，一张训练集图片对应一张adapted IC13图片
10-AD-IC13表示用IC13数据集和目标数据集的训练集做1-10 adaption，一张训练集图片对应10张adapted IC13图片
target为目标数据集的训练集