python api调用tesseract_百度 OCR API 的使用以及与 Tesseract 的简单对比

要比较全面、客观地对比出两个不同的产品的性能是需要大量的数据和详尽地设计的,这里只是根据我个人对 OCR 系统的认识,使用了少量的数据进行的对比,至于两者孰优孰劣请读者自行试验再下结论。

图一:

百度 OCR API 识别结果:

讨论代数方程r+积—劲—1=0在(—”0)内实根的情况

Tesseract 识别结果:

讨论代数方程娱+4筹-3χ-l=O在 (-∞,O〉 内实根的情况₋

图二:

百度 OCR API 识别结果:

L(理)已知:是虚数单位.则(―1―D《2―D=一一一一f》 A―3+iB―1―3 C―3+3D―1―1

Tesseract 识别结果:

L₍₋₎已概ᵢ量ᵦ效单位。口(—₁针)(2₋E,= ⋯烟~₋ (

A₋₋₃+ᵢ BL-{•S宜

C.-3+3i D·一l震拿

罐震 ,△、an.△ᵅ=₂₋!₋₃—?又₋T=xf —$⩽ᵣ⩽玉 ₋l S校 r= —

图三:

百度 OCR API 识别结果:

新课标全国)在一组样本数据(Xl,y)G,y)%不全相等的散点图中,若所有样本点ki,y4+|上,则这组样本数据的样本相关系数为0 Boc.号

Tesseract 识别结果:

!新课标全国)在岗组样本数据Uh趴汕懒h…

蘑. 不全相等)的散点图中,若所有样本点牺酬

L篆+I 上,则这组样本数据的样本相关系数为 o

1

B.0 时

图四:

百度 OCR API 识别结果:

11分)如图271日.在△A风中,∠C=45·现妹10.高AD=8.矩形EFPQ的一边吐在风边上,1

Tesseract 识别结果:

.’⁻.∴ 、,〉 、、.罐’∣【

r\∪【川 '′ ∣⋃./L 、∥('中.

"pQ的

图五:

百度 OCR API 识别结果:

B

Tesseract 识别结果:

乐散说, 你是找的全部

你是耕掌希宁触-都余

但找的主命宁

猪漆能装有你

就傅

她环东能玻节玻引才

A美未能表有童气

大她东能装有四兔

从以上这些对比,我得到以下一些 不一定客观 的结论:

百度的 OCR 系统对噪声、模糊等有较强的抗干扰性,这一点上要优于 Tesseract

百度的 OCR 系统没有进行布局分析,但 Tesseract 在布局分析上做得比较好

百度的 OCR 系统 可能 对 黑底白字 的图像识别不好

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值