OCR测试——阴影和角度

测试目的:测试图片中阴影和拍摄图片的角度对文字识别的影响。

一、测试图片选择:

1. 阴影

1)图片中阴影占比:

①没有阴影;②阴影占 1/4 左右;③阴影占 1/2 左右;④阴影占 3/4 左右;⑤文字完全被阴影遮住。

2)阴影方向:

①横向;②纵向。

2. 拍摄角度

1)竖直方向上:

①45度;②90度;③135度。

2)水平方向上:

①45度;②90度;③135度。

二、测试结果(图片对比)

1. 阴影

1)横向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率: 0.9642 / 0.9351

耗时:1.819s / 1.206s

竞品:               

②阴影占 1/4 左右(v_2) 

阴影占 1/4 左右(v_3) 

召回率:0.9957 / 0.9528

准确率:0.9671 / 0.9124

耗时: 2.042s / 0.838s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9399 / 1.0000

准确率:0.9634 / 0.9183

耗时:2.039s / 1.340s 

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)  

召回率:0.9957 / 1.0000

准确率:0.9717 / 0.9149

耗时:2.442s / 0.707s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:0.9914 / 1.0000

准确率:0.9688 / 0.9185

耗时:1.881s / 1.208s

竞品:

2)纵向阴影

①没有阴影(v_2)

没有阴影(v_3)

召回率:0.9399 / 1.0000

准确率:0.9642 / 0.9351

耗时:1.820s / 1.211s

竞品:

②阴影占 1/4 左右(v_2)

阴影占 1/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9608 / 0.9267

耗时: 1.746s / 1.247s

竞品:

③阴影占 1/2 左右(v_2)

阴影占 1/2 左右(v_3)

召回率:0.9957 / 0.9571

准确率:0.9630 / 0.9219

耗时:2.021s / 1.132s

竞品:

④阴影占 3/4 左右(v_2)

阴影占 3/4 左右(v_3)

召回率:0.9957 / 1.0000

准确率:0.9659 / 0.9158

耗时:2.306s / 0.756s

竞品:

⑤文字完全被阴影遮住(v_2)

文字完全被阴影遮住(v_3)

召回率:1.0000 / 1.0000

准确率:0.9610 / 0.9218

耗时:1.822s / 1.864s

竞品:

2. 拍摄角度

1)竖直方向

①45度(v_2)

45度(v_3)

召回率:0.9914 / 0.9142

准确率:0.9697 / 0.9203

耗时:2.480s / 0.763s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9673 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:0.9099 / 0.9914

准确率:0.9678 / 0.9099

耗时:3.642s / 0.953s

竞品:

2)水平方向

①45度(v_2)

45度(v_3)

召回率:0.9957 / 1.0000

准确率:0.9718 / 0.9161

耗时:1.956s / 0.671s

竞品:

②90度(v_2)

90度(v_3)

召回率:1.0000 / 0.9571

准确率:0.9674 / 0.9316

耗时:1.872s / 0.835s

竞品:

③135度(v_2)

135度(v_3)

召回率:1.0000 / 1.0000

准确率:0.9698 / 0.9186

耗时:1.417s / 0.599s

竞品:

三、测试结果数据对比

1. 阴影

1)横向

v_2召回率准确率耗时
没有阴影0.93990.96421.819s
1/4 阴影0.99570.96712.042s
1/2 阴影0.93990.96342.039s
3/4 阴影0.99570.97172.442s
完全阴影0.99140.96881.881s
v_3召回率准确率耗时
没有阴影1.00000.93511.206s
1/4 阴影0.95280.91240.838s
1/2 阴影1.00000.91831.340s
3/4 阴影1.00000.91490.707s
完全阴影1.00000.91851.208s

2)纵向

v_2召回率准确率耗时
没有阴影0.93990.96421.819s
1/4 阴影0.99570.96081.746s
1/2 阴影0.99570.96302.021s
3/4 阴影0.99570.96592.306s
完全阴影1.00000.96101.822s
v_3召回率准确率耗时
没有阴影1.00000.93511.206s
1/4 阴影1.00000.92671.247s
1/2 阴影0.95710.92191.132s
3/4 阴影1.00000.91580.756s
完全阴影1.00000.92181.864s

2. 拍摄角度

1)竖直方向

v_2召回率准确率耗时
45度0.99140.96972.480s
90度1.00000.96731.872s
135度0.90990.96783.642s
v_3召回率准确率耗时
45度0.91420.920340.763s
90度0.95710.93160.835s
135度0.99140.90990.953s

2)水平方向

v_2召回率准确率耗时
45度0.99570.97181.956s
90度1.00000.96731.872s
135度1.00000.96981.417s
v_3召回率准确率耗时
45度1.00000.91610.671s
90度0.95710.93160.835s
135度1.00000.91860.599s

四、总结

1. 阴影

1)无阴影时,可以检测一整行为一个文本框;在阴影覆盖区域,一行文字会被识别为多个文本框。

2)横向阴影和纵向阴影对文本检测识别的影响的区别不大。

3)阴影对文本检测和识别的影响不大。

2. 角度

1)水平方向上拍摄角度的不同,对检测识别的影响不大。

2)竖直方向上拍摄角度的不同,对检测识别的影响较大。

3. 模型

1)召回率:v_3 略优于 v_2 。

2)准确率:v_2 优于 v_3 。

3)耗时:v_2 大于 v_3 (v_3 的速度比 v_2 快)。

4)竞品的召回率和准确率较高(几乎都是1.0000),偶尔会出现连字现象;竞品检测识别速度大概在 5~6 秒(包含网络传播时延)。

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值