论文调研

一、论文部分

基于傅里叶文档恢复的鲁棒文档去锐化与识别https://www.semanticscholar.org/paper/Fourier-Document-Restoration-for-Robust-Document-Xue-Tian/64dcd0cac46b936eb413f36b462be3b5b298c75b

1. 由于这篇论文没有给代码,所以去参考文献查找:

connected papers 上查找相关的论文。

2. Hao Feng 这个作者有一系列工作:

 其中2022年的文章发表在ECCV

准备调研一下这篇论文。

3. 论文思想

        论文提出了 DocGeoNet 扭曲文档图片矫正算法。思路是3D形状为矫正扭曲的文档图像提供了全局的不扭曲线索,同时忽略了局部结构。文本线补充地为局部提供显式几何约束。

        DocGeoNet 利用了变形文档图片的两个属性:

1)3D形状(提供全局细节);

2)文本线(提供局部细节)。

        DocGeoNet 主要由三个部分组成:

1)预处理模块将前台文档从集群背景中分离出来;

2)结构编码器和文本线提取器,分别对变形文档的三维形状进行建模和提取弯曲的文本线;

3)校正解码器,用于估计失真校正的翘曲流量。

4. 论文中的效果展示图片:

 

二、代码部分

1. 论文代码地址:代码地址

2. 代码中预置图片矫正效果(左:原图,右:矫正):

 

3. 自己测试的结果(左:原图,右:矫正):

 

 测试的效果没有想象的好。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值