图像方向矫正和透视变换处理

一、前期工作

在对图片文字识别中发现图片的质量对识别结果有很大影响。

在日常拍摄的图片大多存在着旋转和透视变换的问题,之前尝试过几何方法和一些深度学习的模型。但几何方法效果不好,深度学习的模型大小太大,不方便移植到移动端。

二、当前进展

通过利用前期工作找到的深度学习模型的数据集,我们基于 PaddlePaddle 平台的 PaddleSeg 重新训练出了一个图像语义分割模型。

该模型可以找到图片中的文字区域,我们通过对文字区域的处理实现了对图片增强的目的。

1. PaddleSeg

PaddleSeg 是基于飞桨 PaddlePaddle 的端到端图像分割套件,代码开源,基于该套件训练出的模型可以移植到移动端。

2. MobileSeg 模型

MobileSeg 模型是 PaddleSeg 的超轻量级语义分割模型。

模型大小: 12 MB

模型处理对图片大小的影响:部分图片处理后会减小或不变,部分图片处理后会增大,但增大幅度在30%~50%区间

模型处理速度:

PS: FPS 指的是每秒可以处理的帧数,即每秒可以处理的图片

3. 代码处理

代码运行速度可以一秒处理一张图片

三、图片测试

以下图片是在之前测试中难以被矫正的图片

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比


原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比


原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比


原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比


原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比


原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值