PaddleOCR
文章平均质量分 57
落花逐流水
从事人工智能,模式识别与智能系统
展开
-
paddlepaddle升级新版本
Q:PaddlePaddle发布新版本了,旧版本该怎样升级呢?A:可以在终端命令中增加 -U参数 pip install -U paddlepaddle-gpu 或者 pip install paddlepaddle==需要安装的版本号参考:PaddlePaddle发布新版本了,旧版本该怎样升级呢 - PaddlePaddle 飞桨 FAQ合集 - 安装配置2...原创 2021-05-26 21:48:43 · 4225 阅读 · 0 评论 -
paddle实现focal loss
paddle 里面没有 focal loss 的API,不过这个loss函数比较简单,所以决定自己实现尝试一下。在 paddle 里面实现类似这样的功能有两种选择:使用 paddle 现有的 op 去组合出来所需要的能力自己实现 op– python 端实现 op– C++ 端实现 op两种思路都可以实现,但是难度相差很多,前者比较简单,熟悉 paddle 的数学操作,理解公式含义即可。后者又分两种方式,python 端实现相对简单,C++端实现比较复杂。这次尝试用 paddle 的 op 组合原创 2021-05-21 22:31:02 · 823 阅读 · 0 评论 -
paddle2.0模型转onnx
自己开始用paddle时就是2.0版本了,所以不关心之前的版本。1、查看本地有没有安装onnx进入paddle 环境conda list或者pip list如果没有安装onnx则先安装onnx,onnx版本匹配是一个令人头疼的问题。暂且不考虑版本问题直接使用下面的命令安装。pip install onnx2、安装paddle2onnxpip install paddle2onnx3、导出onnx模型导出onnx模型的大致步骤如下:import osimport time原创 2021-05-20 17:23:52 · 2188 阅读 · 0 评论 -
paddleocr测试结果写到txt
list 和tuple都可以通过下标索引。python tools/infer/predict_rec.py --image_dir="./test/img/" --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=True --us原创 2021-05-13 23:32:23 · 1655 阅读 · 0 评论 -
PPOCRLabel工具的使用
PPOCRLabel加载模型的路径是从这里来的,执行命令python PPOCRLabel.py --lang ch后,脚本会自动从云端下载训练好的模型,放到C:\Users\Administrator\.paddleocr目录下,对应于"~/.paddleocr"原创 2021-04-13 20:46:20 · 6868 阅读 · 0 评论 -
PPOCRLabel标注格式转icdar15格式
在使用PaddleOCR中的标注工具PPOCRLabel标注完样本,需要转换成icdar15标注格式。PPOCRLabel只提供了gen_label.py可以把icdar15格式转换成PPOCRLabel格式。下面自己完成了一下PPOCRLabel格式icdar15格式。# -*- coding : UTF-8 -*-# @file : conver_json_icdar.py# @Time : 2021/4/9 11:24# @Author : wmzimport osi原创 2021-04-10 10:26:35 · 744 阅读 · 0 评论 -
paddleocr遇到的问题汇总
1、win10下,有的电脑训练时train.py第 39行会报找不到import tools.program as program解决办法:在需要导入的那个文件夹里面新建一个 __init__.py文件,哪怕这个文件是空的文件也可以.原创 2021-04-08 18:07:45 · 1973 阅读 · 0 评论 -
paddleocr学习笔记(八)训练自己的文字识别数据
数据集:/PaddleOCR/doc/doc_ch/datasets.md数据合成工具:/PaddleOCR/doc/doc_ch/data_synthesis.md文字识别训练:/PaddleOCR/doc/doc_ch/recognition.md暂时没有自己的数据,只能用开源数据练手。原创 2021-03-10 21:11:37 · 6114 阅读 · 23 评论 -
paddleocr学习笔记(七)训练自己的文字检测数据
paddle高阶API课程中学到的万能公式:(1) 问题定义--(2)数据准备--(3)模型选择和开发--(4)模型训练和调优--(5)模型评估测试--(6)部署上线我们使用PaddleOCR,问题已经定义好了就是文字识别任务,模型框也都有,除非你要尝试新的模型。我们可以做的就是针对自己的具体任务准备自己的数据,并将数据做一定的扩充,学名叫数据增强,然后就可以开启训练了。最终省钱笔记(六)里面使用的模型。自己的数据准备这里还是参照官方文档将数据标注转换成PaddleOCR训练需要的格式,比如原创 2021-03-08 21:23:52 · 2118 阅读 · 2 评论 -
vs2015在release下调试paddleocr
一共分四步:第一步:1.工程项目上右键 打开属性界面2.c++---常规----调试信息格式选 程序数据库(/Zi)或(/ZI), 注意:如果是库的话,只能(Zi)第二步:3.c/c++----优化----优化 配置 选禁止(/Od)第三步:4.连接器 ---调试 ----生成调试信息 选是 (/DEBUG)第四步:5、设置调试启动路径和参数信息参考:VS2015在release模式下进行调...原创 2021-03-06 15:05:40 · 510 阅读 · 0 评论 -
paddleocr学习笔记汇总
笔记计划设计paddleocr从官网教程开始一步步走完整个流程,涉及:训练、评估、推理、转换模型、c++部署、python部署、docker使用等。然后是准备自己数据进行训练到部署,接着就是代码分析,数据加载、数据增强、调参、损失函数设计、模型骨架选择、优化模型方法等。...原创 2021-02-27 16:54:29 · 901 阅读 · 0 评论 -
paddleocr学习笔记(六)C++推理
参考:\PaddleOCR\deploy\cpp_infer\readme.md原创 2021-02-27 16:48:11 · 1543 阅读 · 0 评论 -
paddleocr学习笔记(五)将训练模型(checkpoints模型)转化为推理模型(inference模型)
这个主要参考PaddleOCR下的 /doc/doc_ch/inference.md原创 2021-02-25 22:24:56 · 6246 阅读 · 7 评论 -
paddleocr学习笔记(四)评估、推理
继续前面的内容:paddleocr学习笔记(三)训练代码分析1、评估当训练完成时需要查看评估结果可以执行下面代码评估:执行最佳模型评估python tools/eval.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./output/db_mv3/best_accuracy PostProcess.box_thresh=0.5 PostProcess.unclip_ratio=1.5评估结果如下:[2021/02/原创 2021-02-25 21:46:31 · 3462 阅读 · 0 评论 -
paddleocr学习笔记(三)训练代码分析
还是从前面的paddleocr学习笔记(二)训练使用的文字检测训练代码学习。python tools/train.py -c configs/det/det_mv3_db.yml -o Global.checkpoints=./output/db_mv3/latest从代码 train.py中分析。想要了解代码是怎样运行的就要调试一下看看,在pycharm下调试设置快捷键:alt+shift+F9入口:...原创 2021-02-23 21:26:22 · 4538 阅读 · 0 评论 -
paddleocr学习笔记(二)训练
paddleocr训练包括三个方面的内容:文字检测、方向判断、文字识别。下面逐一说明:在PaddleOCR/doc/doc_ch/detection.md中有说明文字检测:数据准备--启动训练--断点训练--评估指标--测试检测效果将下载到的数据集解压到工作目录下,假设解压在 PaddleOCR/train_data/ 下。另外,PaddleOCR将零散的标注文件整理成单独的标注文件 ,您可以通过wget的方式进行下载。# 在PaddleOCR路径下cd PaddleOCR/wge原创 2021-02-22 22:45:50 · 5301 阅读 · 1 评论 -
paddleocr 使用教程
打开从github上下载的最新PaddleOCR先对整个项目有一个总体的认识吧:从上到下文件夹依次为:configs、deploy、doc、inference、inference_results、ppocr、PPOCRLabel、StyleText、Tools共9个文件夹。1、configs文件夹这个文件夹下是方向分类、文本检测、文字识别的配置文件。配置文件中描述的内容包括如何训练、模型结构、优化器、训练参数、训练数据来源等。先看训练的脚本train.sh:# recomme.原创 2021-02-02 22:19:01 · 14739 阅读 · 2 评论 -
paddleocr学习笔记(一)从官网开始
官网github说明:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/README_ch.mdEnglish| 简体中文简介PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。注意PaddleOCR同时支持动态图与静态图两种编程范式动态图版本:dygraph分支(默认),需将paddle版本升级至2.0.0(快速安装) 静态图版本:develop分支近期更新20.原创 2021-01-30 10:38:11 · 2567 阅读 · 0 评论