line = new_path+‘\t’+‘[{“transcription”: “%s”, “points”: %s}]’ % (’ ', str(points))
line = line[:]+‘\n’
total.append(line)
random.shuffle(total)
with open(‘/home/work/data/train.txt’, ‘w’, encoding=‘UTF-8’) as f:
for line in total[:-200]:
f.write(line)
with open(‘/home/work/data/dev.txt’, ‘w’, encoding=‘UTF-8’) as f:
for line in total[-200:]:
f.write(line)
检查data下的两个txt文件
第三步:配置环境
1.升级PaddlePaddle
!pip install paddlepaddle-gpu==2.2.1.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
2.下载PaddleOCR
!git clone https://gitee.com/PaddlePaddle/PaddleOCR.git
3.下载预训练模型
cd /home/work/PaddleOCR
!wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/ch_models/ch_det_mv3_db.tar!wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/rec_mv3_tps_bilstm_attn.tar
cd pretrain_models
!tar -xf ch_det_mv3_db.tar && rm -rf ch_det_mv3_db.tar!tar -xf rec_mv3_tps_bilstm_attn.tar && rm -rf rec_mv3_tps_bilstm_attn.tar
第四步:保存Notebook并关闭、停止运行
================================================================
第一步:重新安装环境
1.启动Notebook并打开
2.重新执行以下安装命令
第二步:安装PaddleOCR相关依赖文件
1.修改requirements文件
删除opencv-contrib-python==4.4.0.46
2.执行以下两个安装命令
cd /home/work/PaddleOCR
!pip install -r requirements.txt
!pip install opencv-contrib-python==4.2.0.32
第三步:修改模型训练的yml文件
进入路径PaddleOCR/configs/det/
打开det_mv3_db.yml
1.修改模型路径和保存路径
2.修改训练数据的路径
训练集:
验证集:
3.设置训练参数
epoch数:
batch_size:
第四步:模型训练
CUDA_VISIBLE_DEVICES=0!python3 tools/train.py -c configs/det/det_mv3_db.yml
第五步:保存Notebook并关闭、停止运行
================================================================
第一步:重新安装环境
1.启动Notebook并打开
2.重新执行以下安装命令
升级PaddlePaddle
安装相关依赖
第二步:导出文字检测模型
!python3 /home/work/PaddleOCR/tools/export_model.py \ -c /home/work/PaddleOCR/configs/det/det_mv3_db.yml \ -o Global.checkpoints=/home/work/PaddleOCR/output/db_mv3/best_accuracy \ Global.save_inference_dir=/home/work/PaddleOCR/inference/
第三步:下载安装文字识别模型
!wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_server_v2.0_rec_infer.tar!tar -xf ch_ppocr_server_v2.0_rec_infer.tar -C inference
第四步:模型预测
1.上传一张车牌图片作为预测图片
最后
🍅 硬核资料:关注即可领取PPT模板、简历模板、行业经典书籍PDF。
🍅 技术互助:技术群大佬指点迷津,你的问题可能不是问题,求资源在群里喊一声。
🍅 面试题库:由技术群里的小伙伴们共同投稿,热乎的大厂面试真题,持续更新中。
🍅 知识体系:含编程语言、算法、大数据生态圈组件(Mysql、Hive、Spark、Flink)、数据仓库、Python、前端等等。
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!