本期学习内容是“英特尔创新大师杯”深度学习挑战赛:通用场景OCR文本识别任务,本次比赛的主要目的是以端到端的方式检测和识别所提供图像中的每个文本实例。主要任务为中文文本识别。阿水大神开源出自己的baseline来作为学习内容。
比赛链接:https://tianchi.aliyun.com/competition/entrance/531902/introduction
阿水大神的baseline是在百度paddleOCR基础上进行调优的,由于暑期回家,身边没有高算力的机器, 我选择使用百度的AIStudio平台来跑baseline。AIstudio一天可以嫖八个小时V100使用时长,是我这种炼丹乞丐的福音了。
进入环境首先把baselineGit下来,
按照步骤下载模型
验证能否运行
在AIStudio中并不能直接训练,需要修改部分配置文件
tianchi-intel-PaddleOCR/configs/det/ch_ppocr_v2.0/ch_det_res18_db_v2.0.yml
将上述路径下的num_workers修改,就可以正常运行了。按照剩下的步骤把代码跑完,导出提交文件就OK了。
开源地址:https://mp.weixin.qq.com/s/ja567q3j5gnndKeMV2M_Yg
baseline地址:https://gitee.com/coggle/tianchi-intel-PaddleOCR