贡献
- 在cycleGAN基础上做的改进
- 设计了一个网络,首次同时在geometry and appearance spaces做domain shifts
- 设计了multi-modal spatial 学习机制,引入一个spatial transformation discriminator,在几何空间实现multi-modal adaptation
- 设计了一个cycle-consistency loss,用于geometry 和 appearance space
GA-DAN架构
蓝色为spatial module
绿色为生成器
橙色为鉴别器
spatial module
包含spatial code、transformation module T T T 和 localization network L N X LN_{X} LNX和 L N Y LN_{Y} LNY,用来预测一个transformation矩阵,来对输入图像做几何转换,
生成器
用来补全背景和translate the image style
实验
文字检测
AD-IC13表示用IC13数据集和目标数据集的训练集做adaption,一张训练集图片对应一张adapted IC13图片
10-AD-IC13表示用IC13数据集和目标数据集的训练集做1-10 adaption,一张训练集图片对应10张adapted IC13图片
target为目标数据集的训练集