原论文:Two-Stage Generative Adversarial Networks for Document Image Binarization with Color Noise and Background Removal
开源代码(pytorch框架):https://github.com/opensuh/DocumentBinarization/
1.主要工作:
提出了基于GAN网络的文档图像二值化方法(二值化,即正确区分背景和字符)。最终的输出图像就是二值灰度图。
该方法解决了文档图像多彩色退化问题。(采用四个独立的网络,对应四个颜色通道)
将局部二值化与全局二值化网络结合起来,能够更加精确地区分背景部分和字符部分。
整个网络方案分为两个阶段:
第一,利用多色通道对抗神经网络从局部图像块中去除背景信息,并提取彩色前景信息。实现文档图像增强。
第二,利用多尺度对抗神经网络生成文档图像的局部二值化结果图像和全局二值化结果图像。实现文档图像二值化。
2.主体网络架构:
网络主体分为两部分:生成器网络G ;判别器网络D;
生成器网络G采用经典的 跳跃连接U-