OCR测试—文字密度和中英文

一、测试目标

测试图片中文字密度和中英文混合对文字识别的影响.

二、测试效果

2.1 文字密度

文字密度占比分别为 10%, 30%, 50%, 70%, 90%

2.1.1 文字密度占10%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.9524 / 1 / 1

准确率: 0.9962806522846221 / 0.9552404511542547 / 1

耗时: 2.791s / 1.652s / 7.231s

2.1.2 文字密度占30%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 1 / 1 / 1

准确率: 0.9914099194786765 / 0.8890374269750383 / 1

耗时: 2.874s / 2.403s / 7.683s

2.1.3 文字密度占50%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 1 / 1 / 1

准确率: 0.947605924172835 / 0.9050272788320269 / 1

耗时: 1.887s / 4.154s / 7.091s

2.1.4 文字密度占70%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 1 / 1 / 1

准确率: 0.993117007944319 / 0.9413371117491471 / 1

耗时: 2.320s / 1.282s / 7.683s

2.1.5 文字密度占90%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.8929 / 0.9286 / 1

准确率: 0.9453809309005737 / 0.9491195160409679 / 1

耗时: 3.575s / 3.706s / 7.945s

2.2 中英文混合

英文在图片中占比分别为 0%, 30%, 50%, 70%, 90%, 100%

2.2.1 英文占比0%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 1 / 1 / 1

准确率: 0.9818116164207459 / 0.9547537684440612 / 1

耗时: 4.688s / 3.742s / 5.687s

2.2.2 英文占比30%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.9189 / 0.8529 / 1

准确率: 0.9627916146727169 / 0.9405301994290846 / 1

耗时: 5.142s / 2.344s / 6.216s

2.2.3 英文占比50%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.9574 / 0.9302 / 1

准确率: 0.94462571144104 / 0.9210820630192756 / 1

耗时: 5.573s / 3.177s / 6.346s

2.2.4 英文占比70%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.86 / 0.7826 / 1

准确率: 0.940701121507689 / 0.9091679023371803 / 1

耗时: 3.995s / 2.132s / 5.312s

2.2.5 英文占比约100%

(1) 对比图

V2 模型

V3 模型

竞品

(2) V2 / V3 / 竞品 对比

召回率: 0.9074 / 0.8824 / 1

准确率: 0.9420735179161539 / 0.8946475161446465 / 1

耗时: 4.217s / 2.261s / 5.743s

三、总结

3.1 文字密度占比总结

(1) 总体来说, 文字密度在 v2 和 v3 两个模型上对检测有一定影响, 当文字稀疏且文字并非以单个字符出现时容易被检测到, 以单个字符出现时则不容易被检测到. 当图片中存在一定文字时, v3 的检测强于 v2.

文字密度对 v2 和 v3 两个模型识别准确度没有明显影响, 但 v3 准确度明显低于 v2, 但是 v3 的速度明显快于 v2.

以上识别和检测, 竞品皆优与 v2 和 v3 模型, 但速度上慢于 v2 和 v3 模型.

(2) 对比表

测试项目 (v2 / v3 / 竞品)召回率准确率耗时
文字密度占10%0.9524 / 1 / 10.996 / 0.955 / 12.791s / 1.652s / 7.231s
文字密度占30%1 / 1 / 10.991 / 0.889 / 12.874s / 2.403s / 7.683s
文字密度占50%1 / 1 / 10.948 / 0.905 / 11.887s / 4.154s / 7.091s
文字密度占70%1 / 1 / 10.993 / 0.941 / 12.320s / 1.282s / 7.683s
文字密度占90%0.8929 / 0.9286 / 10.945 / 0.949 / 13.575s / 3.706s / 7.945s

3.2 英文占比总结

(1) 在测试图片中出现了多个单字符的情况, v2 和 v3 模型都不能正确检测.

总体来说, 中英文混合占比不同基本不会影响文本的检测和识别.

v2 模型的检测在这方面优于 v3 模型, 但依旧存在 v2 模型的识别速度慢于 v3.

以上情况, 竞品都能很好的检测和识别, 且速度与 v2 和 v3 模型持平.

(2) 对比表

测试项目 (v2 / v3 / 竞品)召回率准确率耗时
英文占比0%1 / 1 / 10.982 / 0.955 / 14.688s / 3.742s / 5.687s
英文占比30%0.9189 / 0.8529 / 10.963 / 0.941 / 15.142s / 2.344s / 6.216s
英文占比50%0.9574 / 0.9302 / 10.945 / 0.921 / 15.573s / 3.177s / 6.346s
英文占比70%0.86 / 0.7826 / 10.941 / 0.909 / 13.995s / 2.132s / 5.312s
英文占比100%0.9074 / 0.8824 / 10.942 / 0.895 / 14.217s / 2.261s / 5.743s

3.3 其他

v2 模型部署到服务器上, 运行时占用显存为 1700MB

v3 模型部署到服务器上, 运行时占用显存为 870MB

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值