天池ORC文本识别任务比赛

赛题链接:https://tianchi.aliyun.com/competition/entrance/531902/information

赛题背景

在现实场景中,我们会遇到很多的文字信息,例如:书本中的文字,海报中的文字,票据中的文字等等。可以说,现实场景中的文字是人们生活中必不可少的部分;人们的生活和工作中,很多时候都是需要获取这些文字的信息,并使用它们。而在使用它们的时候,往往需要将它们转化成为存储在电子设备中的文本信息。OCR任务旨在解决这类问题:将现实场景中的文字信息,转化为电子设备可以处理的文本信息。更进一步地,我们希望找到一种通用OCR算法,它能够解决不同现实场景和应用场景下的文字信息,以满足人们在不同行业应用中的需求。

详细的提交说明和评判准则请查看链接。

本文章主要说一下在奔跑程序的时候遇到的几个BUG(修改了好久)。

BUG1

运行设备:LInux-x86 ubantu 18.04系统   GPU使用3090   cuda安装的11.1版本   cudnn 安装 11.1-8.0.4

首先遇到了这么一个问题:

å¨è¿éæå¥å¾çæè¿°

 问题就是cudnn的软连接找不到

解决方案:

https://blog.csdn.net/qq451882471/article/details/106967942

可以看一下这一篇文章  

但是我跟着修改完了之后依旧没有能行 

然后查了一下cudun 版本号 可能是不对应的问题 . 本身在下载paddle-GPU的时候下的为11.0版本的Paddle-GPU,仔细在查看Paddle的官网后发现需要cudnn为8.0.4版本,如下图所示:


 需要去nvidia官网下载对应版本的cudnn,然后将配置文件移动到所需要的目录中去,对于Linux的本的cudnn,建议下载压缩包文件。

 

然后在移动之前进行解压缩,下边这个包下载下来是一个.solitairetheme8后缀的文件。可以根据下边链接文章进行压缩变换:

https://blog.csdn.net/littlehaes/article/details/103202156

具体的文件移动可以看下边链接文章:(Windows和Linux下都有)

https://www.jianshu.com/p/622f47f94784

将文件配置好这个bug就解决了。

BUG2

原始的ubantu系统下没有安装simsun.ttf 这个字体的 ,也就是仿宋。

解决方案:

源代码中需要这个字体,出现了缺少资源的报错。不管是需要什么字体,可以看下边文章进行配置,https://www.jianshu.com/p/a8fad635490d  可以参考这篇文章,如何将所需要的字体部署在Linux上。亲测是可以de。

BUG3

PaddleDetection 出现

AssertionError:Bad argument number for Assign:2,expecting 3

解决方案:

是因为gast 版本过高导致的,原始版本我安装的0.5.0,直接删掉gast库,重新安装0.3.3版本即可。

pip uninstall gast

pip install gast==0.3.3

BUG完事后终于调通

提交得分:

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值