mmocr使用踩坑记录

最近在用mmocr修改模型,下面是一些踩坑记录:

1.opencv版本问题

File “/home/mmocr/models/textdet/postprocess/wrapper.py”, line 451, in fcenet_decode
cv2.CHAIN_APPROX_SIMPLE) # opencv4
ValueError: too many values to unpack (expected 2)
出现这个错误就是你的opencv版本要改成4以上的,
pip install opencv-python==4.0.0.21

2.骨干网络

注册表里发现没有SwinTransformer,
1.应该是configs里的backbone里的type写错了,写成这个格式: type=‘mmdet.SwinTransformer’,
因为mmcv里没有SwinTransformer,SwinTransformer只属于mmdet。
2.或者自己创建一个骨干网络,独属于mmocr,
在mmocr/models/textdet/backbones里创建,记得要注册到mmocr的backbones中。

3.AttributeError: ‘NoneType’ object has no attribute ‘shape’

mlt2017数据集进行转换的时候出现了上述问题。原因是数据集中有的照片没有进行转码,只是更改了后缀,所以在模型加载的时候会报错,用PIL工具将所有的gif图片转换成为png图片就可以了
训练集是img_401.gif、img_478.gif、img_1187.gif、img_1188.gif出错
验证集我错的也是这几个序号,???

全部转换

import PIL.Image
import os
i=0
path = "/home/sys1/ycs/mmocr/data/mlt2017/imgs/test1/"
savepath = "/home/sys1/ycs/mmocr/data/mlt2017/imgs/test/"
filelist = os.listdir(path)
for file in filelist:
    im = PIL.Image.open(path+filelist[i])
    filename = os.path.splitext(file)[0]
    im.save(savepath+filename+'.png')
    i=i+1
    print(i)

单个转换

import PIL.Image
im = PIL.Image.open('conver/img_401.jpg')
im.save('img_401.jpg') 

4.数据集

ICDAR竞赛的数据集在以下网址:
https://rrc.cvc.uab.es/?ch=16&com=downloads
只要注册个账号就可以下载,记得要转换mmocr里的格式。

5.python mmocr/utils/ocr.py

python mmocr/utils/ocr.py 出现
mmocr/core/visualize.py:181: UserWarning: 0 text found in demo/img.jpg
warnings.warn('0 text found in ’ + out_file)
应该是pth文件出错,重新训练得到权重就可

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值