图像处理
文章平均质量分 72
WiSirius
这个作者很懒,什么都没留下…
展开
-
图像处理:文档矫正DocTr++
这段时间一直在搞文档矫正相关实验,阅读了大量相关论文,今天来记录一篇目前比较经典,实用性较好的方法,doctr++Doctr++除了提出一种新的architecture外,most importantly,提出了一种新的数据处理方式,解决了以前文档矫正只能处理带有边界信息的完整文档,文章通过数据处理定义了三种类型的训练数据。图1展示了三类常见的形变文档图像:(a) 包含完整文档边界,(b) 包含部分文档边界,(c ) 不包含文档边界。原创 2024-05-21 11:22:24 · 595 阅读 · 0 评论 -
图像处理:图像噪声添加
本文主要介绍几种添加图像噪声的方法,用于数据增强等操作。目前主流的噪声添加就这么几种,最常用的是高斯和泊松,在数据增强中还是有很大帮助的。原创 2024-05-08 16:40:58 · 866 阅读 · 2 评论 -
图像处理:动态模糊
动态模糊在实际拍照场景中出现较多,主要造成原因是在拍摄瞬间相机的突然抖动形成的,在数据增强方案中可以通过模拟这种退化来使模型适用于这种图片(在该类图片中产生更好的效果)。本文分别提供了用opencv,torch,numpy实现的code。原创 2023-12-12 16:09:45 · 603 阅读 · 0 评论 -
图像处理:空白patch过滤(空白图判断)
在进行训练相关任务时,有时会对图像进行裁决或取patch的操作,进行这种操作后,不可避免的会引入一些空白patch,或内容量很少的图像,这种图像通常会干扰模型的训练,因此最好过滤掉。本文提供了3种方法对图像进行过滤。本文提供了3种方法对图像进行过滤。本人比较喜欢用第三种,能够有效过滤掉一些没有任何意义的图像。原创 2024-01-09 16:04:05 · 467 阅读 · 0 评论 -
图像处理:文档图像矫正DDCP
文档图像矫正简单来说就是由于纸张的物理变形、拍摄环境和相机位置,相机捕获的文档图像经常会出现扭曲和背景问题。上述因素将显着增加信息提取和内容分析的难度。为了减少文档图像处理中失真的影响而采取的措施。本文要介绍的方法为。github:以往的研究将几何校正任务视为密集网格预测问题,将二维图像作为输入,输出一个正向映射(每个网格表示出扭曲输出图像中像素点的坐标,像素点对应出扭曲输入图像中的像素点)或反向映射(每个网格表示出扭曲输入图像中像素点的坐标)。原创 2024-01-23 20:54:59 · 1048 阅读 · 0 评论