![](https://img-blog.csdnimg.cn/20190927151026427.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
PaddlePaddle
文章平均质量分 50
Paddle相关
博观而约取,厚积而薄发
这个作者很懒,什么都没留下…
展开
-
paddleocr实验过程
切割后的数据在train_data中,注意切割后的数据前缀默认是当前目录,因此建议切割数据在liunx中进行。或者修改下面--datasetRootPath中的default。如果在Win中切割,放入liunx中训练。1、打开tmux窗口启动,这样断开连接后台可以继续训练。2、根据需求修改配置文件,如输出名称,数据集位置,注意暂时不要改吧epoch,训练容易报错。建议在liunx中指定。原创 2024-06-11 18:07:33 · 464 阅读 · 0 评论 -
OCR test rec
【代码】OCR test rec。原创 2024-06-06 20:29:21 · 83 阅读 · 0 评论 -
paddleocr det部分的数据增强参数
【代码】paddleocr det部分的数据增强参数。原创 2024-05-27 14:59:57 · 137 阅读 · 0 评论 -
pip安装paddlepaddle报错ERROR: Could not install packages due to an OSError
这个问题是由于Windows系统路径长度限制导致的。在Windows中,单个文件路径的最大长度有限制(默认为260个字符),这可能会在你尝试安装某些Python包时导致问题,特别是当这些包的路径非常深或包含许多子目录时。原创 2024-02-19 17:20:38 · 1112 阅读 · 0 评论 -
基于Python的paddleocr推理环境列表
基于Python的paddleocr推理环境列表,原创 2024-02-19 17:22:47 · 503 阅读 · 0 评论 -
PP-PicoDet注意版面分析模型的结果导出
使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。原创 2024-02-02 15:02:56 · 465 阅读 · 0 评论 -
阿里云a10GPU,centos7,cuda11.2环境配置
【代码】阿里云a10GPU,centos7,cuda11.2环境配置。原创 2024-02-02 14:26:57 · 1022 阅读 · 0 评论 -
centos gcc4.8升级8
【代码】centos gcc4.8升级8。原创 2024-02-01 14:22:03 · 739 阅读 · 0 评论 -
Failed to build lap ERROR: Could not build wheels for lap, which is required to install pyproject.to
pip安装paddledet,报错。原创 2024-02-01 14:10:21 · 813 阅读 · 0 评论 -
关于paddleocr的predict_system按高度顺序画图
关于paddleocr的predict_system按高度顺序画图,(coco格式)原创 2024-01-30 13:45:52 · 472 阅读 · 0 评论 -
PaddleDetection的推理图像发生旋转
读取时发生旋转,修改一下代码。原创 2024-01-28 17:41:11 · 725 阅读 · 0 评论 -
paddleocr文字识别变迁
对于标准的 DML 策略,蒸馏的损失函数仅包括最后输出层监督,然而对于 2 个结构完全相同的模型来说,对 于完全相同的输入,它们的中间特征输出期望也完全相同,因此在最后输出层监督的监督上,可以进一步添 加中间输出的特征图的监督信号,作为损失函数,即 PP-OCRv2 中的 U-DML (Unified-Deep Mutual Learning) 知识蒸馏方法。在L2正则化的帮助下, 网络的权重趋向于选择一个较小的值,最终整个网络中的参数趋向于0,从而缓解模型的过拟合问题,提高 了模型的泛化性能。原创 2023-12-06 10:49:01 · 1195 阅读 · 0 评论 -
paddleocr文本检测改进变迁
知识蒸馏的方法在部署中非常常用,通过使用大模型指导小模型学习的方式,在通常情况下可以使得小模型 在预测耗时不变的情况下,精度得到进一步的提升,从而进一步提升实际部署的体验。标准的蒸馏方法是通过一个大模型作为 Teacher 模型来指导 Student 模型提升效果,而后来又发展出 DML 互 学习蒸馏方法,即通过两个结构相同的模型互相学习,相比于前者,DML 脱离了对大的 Teacher 模型的依赖, 蒸馏训练的流程更加简单,模型产出效率也要更高一些。FPGM与基于范数的裁剪算法的对比如下图所示。原创 2023-12-04 17:46:36 · 1285 阅读 · 0 评论 -
paddleocr笔记
版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入OCR引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的word或者pdf格式的文件;关键信息抽取任务中,首先使用OCR引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。从算法改进思路来看,对系统中的3个关键子模块,共进行了8个方面的改进。原创 2023-11-27 15:50:22 · 2362 阅读 · 0 评论 -
PaddleOCR训练、测试文档
如图1-1,数据集需要提供train_list.txt,和val_list.txt,具体内容如图1-2,修改配置文件位置图1-3。环境使用anconda创建了”paddle”的虚拟环境,该环境适合paddleOCR。图1-2 train_list.txt,和val_list.txt具体内容。图1-3 修改配置文件位置。编译前,需要注意替换。原创 2023-09-07 15:57:04 · 870 阅读 · 0 评论 -
paddleocr的cpp_infer在Liunx下编译部署
【代码】paddleocr的cpp_infer在Liunx下编译部署。原创 2023-11-22 15:03:20 · 1078 阅读 · 0 评论 -
基于paddleocr的版面分析
文本识别:SVTR_LCNet(将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络)英文:publaynet数据集的训练集合中包含35万张图像,验证集合中包含1.1万张图像。PubTabNet数据集的训练集合中包含50万张图像,验证集合中包含0.9万张图像。验证集未给出可训练的标注。中文:CDLA据集的训练集合中包含5000张图像,验证集合中包含1000张图像。数据集:ICDAR 2015 数据集包含1000张训练图像和500张测试图像。原创 2023-08-23 20:27:53 · 1522 阅读 · 0 评论