OCR-Android端问题总结

mentalps

已于 2023-04-21 09:37:12 修改

阅读量454

点赞数

文章标签： android

于 2023-04-03 19:35:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39133209/article/details/129936634

版权

1 语义模型部转换

1.1 问题一：模型转换

在这里插入图片描述
我们在PC端使用的模型参数文件为pth格式，而andorid端读取模型参数格式的要求为pt，因此需要我们对模型参数进行转换。

1.2.1 解决方案一：直接转换

在这里插入图片描述
可以看到，要想转换成功，必须将模型的输出修改为tuple或NameTuple，此模型为pytorch自带的模型，因此我尝试直接修改对应文件的输出，但是依然解决不了这个问题。

1.2.2 解决方案二：重新训练模型

在之前的调研中，我们不仅找到了该语义模型，同时也找到了其训练数据，因此我们尝试自己训练模型。

2.1 问题二：模型部署问题

pc端的模型移植到android端，不仅需要读取模型参数，同时也要进行推理。

2.2.1 解决方案一：自己重写推理过程

通过潘师兄的指点，了解到我们可以自己手写推理过程，但是我们的模型的结构更加复杂，会影响到推理速度，因此我们放弃了这个方案。

2.2.2 解决方案二：Paddleseg

在不断的调研中，我们发现paddleseg上有许多的语义分割模型，且有相应的推理框架，我们只需利用我们的数据进行训练，然后部署到android端即可。

3.1 问题三：模型部署到Android端后输出错误

我们首先训练了一个deeplabv3_resnet50模型，但是该模型参数庞大，整体有150多M，不适用于android端。因此我们重新训练了一个MobileNetV3模型，只有12M，且效果与deeplabv3_resnet50差不多，但是当我们将其部署到android后，发现其输出存在问题。

3.2.1 解决方案：修改模型输出

经过我们各自调试，我们发现是模型在转换过程中出现了一定问题，具体原因尚不明确，但是我们可以看到，模型输出的图案形状是正确的，只是出现了两个相同的图案，所以我们对这个输出结果进行了加工修改，只取其1/4，并将其放大到原来的大小。

4.1 个别图片会导致程序闪退

在测试时发现，有的图片会使app直接闪退，经过debug调试，找到是语义模型输出的问题，有的图片得到的模型输出为空。
例如以下图片：

4.2 解决方案

在模型返回输出的时候，做一个简单的判断，如果输出为空，则将裁剪边框的位置，设置为图片的边界。

5.1 图片裁剪时被压缩

当图片过大时，为了使裁剪边框能够适应屏幕大小，我们对图片进行了压缩，会使裁剪后的图片变的模糊。

5.2 解决方案

我们仅在显示图片裁剪边框时，对图片进行压缩，在执行裁剪时，还是对原图进行相应操作。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
OCR-Android端问题总结

我们在PC端使用的模型参数文件为pth格式，而andorid端读取模型参数格式的要求为pt，因此需要我们对模型参数进行转换。
复制链接

扫一扫

mentalps CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

54万+: 周排名

176万+: 总排名

3万+: 访问

: 等级

415: 积分

11: 粉丝

3: 获赞

13: 评论

36: 收藏

私信

关注

热门文章

分类专栏

心得体会 3篇
OCR 9篇
日报 14篇
周报 7篇
数学表达式 3篇

最新评论

基于深度学习的文档扫描
mentalps: 先对图片做一点扩充然后画外接矩形得到四个顶点
基于深度学习的文档扫描
wslioy: 请问一下，你这里扫描到了边缘之后，是如何获取到四个顶点的，第三步的图片中，文档的一个角已经在图片外面了，是怎么确定具体位置的
2022/6/29-日报
weixin_44821027: 冒昧的打扰了，有个问题想请教一下，这个将相似度高一一定值的这个聚类思想在文章代码哪个点可以理解呀。
PaddleOCR测试
mentalps: 代码里面有设置模型的参数，改一下就行
PaddleOCR测试
Autopilot: 大佬，请教下怎么更换模型呢？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。