CVPR2020论文:Text Extraction and Restoration of Old
Handwritten Documents
1.主要内容:
a. 构建了一个训练用数据集,采用半自动方法生成ground truth。
b. 提出了一种重建高质量手稿图像的方法。全卷积自编码器来提取退化图像的字符文本(前景),并用高斯混合模型进行背景重建,最后,将字符文本和背景进行融合生成重建图像。
c. 进一步对该方法进行了改进。即采用深度卷积网络代替高斯混合模型进行背景重建。减少了图像重建过程中人为干预,提高了自适应程度。
2.图像重建的主要步骤:
a. 图像预处理
将RGB彩色图像转换为灰度图像。
当背景为亮调时,采用公式:
当背景为暗调时,采用公式:
b. 字符文本提取(自编码器)