GA-DAN: Geometry-Aware Domain Adaptation Network for Scene Text Detection and Recognition

贡献

  • 在cycleGAN基础上做的改进
  • 设计了一个网络,首次同时在geometry and appearance spaces做domain shifts
  • 设计了multi-modal spatial 学习机制,引入一个spatial transformation discriminator,在几何空间实现multi-modal adaptation
  • 设计了一个cycle-consistency loss,用于geometry 和 appearance space

GA-DAN架构

在这里插入图片描述
蓝色为spatial module
绿色为生成器
橙色为鉴别器

spatial module

包含spatial code、transformation module T T T 和 localization network L N X LN_{X} LNX L N Y LN_{Y} LNY,用来预测一个transformation矩阵,来对输入图像做几何转换,

生成器

用来补全背景和translate the image style

实验

文字检测

在这里插入图片描述
AD-IC13表示用IC13数据集和目标数据集的训练集做adaption,一张训练集图片对应一张adapted IC13图片
10-AD-IC13表示用IC13数据集和目标数据集的训练集做1-10 adaption,一张训练集图片对应10张adapted IC13图片
target为目标数据集的训练集

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值