图像方向矫正和透视变换处理

最新推荐文章于 2024-06-23 11:18:08 发布

言山兮尺川

最新推荐文章于 2024-06-23 11:18:08 发布

阅读量1k

点赞数

文章标签：深度学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44309220/article/details/129563463

版权

文章目录

一、前期工作
二、当前进展
三、图片测试

一、前期工作

在对图片文字识别中发现图片的质量对识别结果有很大影响。

在日常拍摄的图片大多存在着旋转和透视变换的问题，之前尝试过几何方法和一些深度学习的模型。但几何方法效果不好，深度学习的模型大小太大，不方便移植到移动端。

二、当前进展

通过利用前期工作找到的深度学习模型的数据集，我们基于 PaddlePaddle 平台的 PaddleSeg 重新训练出了一个图像语义分割模型。

该模型可以找到图片中的文字区域，我们通过对文字区域的处理实现了对图片增强的目的。

1. PaddleSeg

PaddleSeg 是基于飞桨 PaddlePaddle 的端到端图像分割套件，代码开源，基于该套件训练出的模型可以移植到移动端。

2. MobileSeg 模型

MobileSeg 模型是 PaddleSeg 的超轻量级语义分割模型。

模型大小: 12 MB

模型处理对图片大小的影响：部分图片处理后会减小或不变，部分图片处理后会增大，但增大幅度在30%~50%区间

模型处理速度：

PS: FPS 指的是每秒可以处理的帧数，即每秒可以处理的图片

3. 代码处理

代码运行速度可以一秒处理一张图片

三、图片测试

以下图片是在之前测试中难以被矫正的图片

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

原图片

模型识别的文字区域

代码处理后的文字框

矫正前后对比

言山兮尺川

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
图像方向矫正和透视变换处理

在日常拍摄的图片大多存在着旋转和透视变换的问题，之前尝试过几何方法和一些深度学习的模型。通过利用前期工作找到的深度学习模型的数据集，我们基于 PaddlePaddle 平台的 PaddleSeg 重新训练出了一个图像语义分割模型。模型处理对图片大小的影响：部分图片处理后会减小或不变，部分图片处理后会增大，但增大幅度在30%~50%区间。该模型可以找到图片中的文字区域，我们通过对文字区域的处理实现了对图片增强的目的。PS: FPS 指的是每秒可以处理的帧数，即每秒可以处理的图片。模型大小: 12 MB。
复制链接

扫一扫

言山兮尺川 CSDN认证博客专家 CSDN认证企业博客

码龄6年

89: 原创

31万+: 周排名

42万+: 总排名

6万+: 访问

: 等级

927: 积分

47: 粉丝

22: 获赞

16: 评论

149: 收藏

私信

关注

热门文章

最新评论

PaddleOCR服务化部署
安艺伦也999: 层主请问你解决了吗，我的问题和你差不多：我用自己训练的模型进行cpu识别也是正常的，gpu识别就识别不出来，且官方v4模型用gpu就可以正常识别。
PaddleOCR服务化部署
m0_38136055: 我cpu模式识别没问题,gpu模式识别是乱的,没有正常识别
图像方向矫正和透视变换处理
天马行: 什么个矫正法呢？
PaddleOCR在文字检测方面上存在问题
在路上~~: 您好，夸克扫描的图片增强逻辑可以分享吗
图像方向矫正和透视变换处理
wcyong168: 训练数据是什么样的？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。