模仿全能扫描王实现文档和证件扫描

本文介绍如何利用图像处理技术实现类似全能扫描王的文档扫描功能,包括文档定位、仿射变换校正、图像增强处理。在实践中发现,自动定位易受背景影响,增强处理在特定情况下可能过度,需要进一步优化算法以提升泛化性能。
摘要由CSDN通过智能技术生成

工作中常常会用到扫描全能王这个工具,对于少量的文档电子化管理实在是太方便,并且对于商务人士来说文件的管理、打印、移动办公都是非常有用。

因为对图像处理有一定的了解和实际操作,所以在想扫描王的一些扫描功能是否可以自己实现,参考网上部分资料后搭建了一个 简单的文档扫描系统。

扫描王实现流程:
在这里插入图片描述

1 文档定位

文档定位和本人前面一个车牌识别的定位功能大同小异,对于文件扫描一般我们会手动调整一个比较好的位置,所以背景相对来说不会特别复杂。
主要步骤如下:
1、 图片尺寸变换,将图片缩小到一定的尺寸,方便界面显示;
2、将灰度化的图片进行滤波处理,我这里采用的是中值滤波;
3、直接将图片进行二值化处理;
4、图像闭运算;
5、Candy边缘检测;
6、查找轮廓;
7、根据轮廓的大小排序;
8、判断轮廓是否是矩形、轮廓的面积大小、轮廓的周长来定位文档。

2 仿射变换进行文档校正

计算查找到的轮廓四个边的长度,选取长、宽中最大值作为校正的长宽;然后计算旋转矩阵;通过旋转矩阵将图像进行校正变换。

3 图像增强处理

扫描全能王中的扫描功能不是将图片直接进行二值化处理,而是对色彩进行增强和锐化,这样背景中的白、浅黄、灰色等会变成白色,红色、蓝色等文档本身的色彩可以一定程度的保留

  • 0
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值