【个人开源】2D Attentional Irregular Scene Text Recognizer代码复现

项目地址: https://github.com/chenjun2hao/Bert_OCR.pytorch

Unofficial PyTorch implementation of the paper, which transforms the irregular text with 2D layout to character sequence directly via 2D attentional scheme. They utilize a relation attention module to capture the dependencies of feature maps
and a parallel attention module to decode all characters in
parallel.

At present, the accuracy of the paper cannot be achieved. And i borrowed code from deep-text-recognition-benchmark

model
在这里插入图片描述

result
Test on ICDAR2019 with only 51.15%, will continue to improve.
在这里插入图片描述

Feature

  1. Output image string once not like the seqtoseq model

Requirements

Pytorch >= 1.1.0

Test

  1. download the pretrained model Baidu password: kdah.

  2. test on images which in demo_image folder

python demo.py --image_folder demo_image --saved_model <model_path/best_accuracy.pth>
  1. some examples
demo imagesBert_OCR
在这里插入图片描述available
在这里插入图片描述shakesshack
在这里插入图片描述london
在这里插入图片描述greenstead
在这里插入图片描述toast
在这里插入图片描述merry
在这里插入图片描述underground
在这里插入图片描述ronaldo
在这里插入图片描述bally
在这里插入图片描述university
  1. result on benchmark data sets
IIIT5k_3000SVTIC03_860IC03_867IC13_857IC13_1015IC15_1811IC15_2077SVTPCUTE80
84.36779.90791.86091.46588.44886.01065.65463.21568.52781.185

total_accuracy: 78.423


Train

  1. I prepared a small dataset for train.The image and labels are in ./dataset/BAIDU.
python train.py --root ./dataset/BAIDU/images/ --train_csv ./dataset/BAIDU/small_train.txt --val_csv ./dataset/BAIDU/small_train.txt

Reference

  1. deep-text-recognition-benchmark
  2. 2D Attentional Irregular Scene Text Recognizer
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值