![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OCR
文章平均质量分 93
futureflsl
这个作者很懒,什么都没留下…
展开
-
[paddleocr]前沿算法与模型
SAST模型训练额外加入了icdar2013、icdar2017、COCO-Text、ArT等公开数据集进行调优。原创 2024-06-25 07:30:39 · 986 阅读 · 0 评论 -
[paddleocr]知识蒸馏
近年来,深度神经网络在计算机视觉、自然语言处理等领域被验证是一种极其有效的解决问题的方法。通过构建合适的神经网络,加以训练,最终网络模型的性能指标基本上都会超过传统算法。在数据量足够大的情况下,通过合理构建网络模型的方式增加其参数量,可以显著改善模型性能,但是这又带来了模型复杂度急剧提升的问题。大模型在实际场景中使用的成本较高。深度神经网络一般有较多的参数冗余,目前有几种主要的方法对模型进行压缩,减小其参数量。原创 2024-06-25 07:29:42 · 823 阅读 · 0 评论 -
[paddleocr]PP-OCR模型裁剪
复杂的模型有利于提高模型的性能,但也导致模型中存在一定冗余,模型裁剪通过移出网络模型中的子模型来减少这种冗余,达到减少模型计算复杂度,提高模型推理性能的目的。本教程将介绍如何使用飞桨模型压缩库PaddleSlim做PaddleOCR模型的压缩。集成了模型剪枝、量化(包括量化训练和离线量化)、蒸馏和神经网络搜索等多种业界常用且领先的模型压缩功能,如果您感兴趣,可以关注并了解。原创 2024-06-25 07:28:53 · 963 阅读 · 0 评论 -
[paddlocr]PP-OCR模型量化
复杂的模型有利于提高模型的性能,但也导致模型中存在一定冗余,模型量化将全精度缩减到定点数减少这种冗余,达到减少模型计算复杂度,提高模型推理性能的目的。模型量化可以在基本不损失模型的精度的情况下,将FP32精度的模型参数转换为Int8精度,减小模型参数大小并加速计算,使用量化后的模型在移动端等部署时更具备速度优势。本教程将介绍如何使用飞桨模型压缩库PaddleSlim做PaddleOCR模型的压缩。原创 2024-06-25 07:28:19 · 759 阅读 · 0 评论 -
[paddleocr]其它数据标注工具
这里整理了常用的数据标注工具,持续更新中,欢迎各位小伙伴贡献工具~原创 2024-06-24 06:44:33 · 367 阅读 · 0 评论 -
[paddleocr]数据合成工具 Style-Text
Style-Text数据合成工具是基于百度和华科合作研发的文本编辑算法《Editing Text in the Wild》不同于常用的基于GAN的数据合成工具,Style-Text主要框架包括:1.文本前景风格迁移模块 2.背景抽取模块 3.融合模块。经过这样三步,就可以迅速实现图像文本风格迁移。下图是一些该数据合成工具效果图。原创 2024-06-24 06:41:22 · 1080 阅读 · 0 评论 -
[paddleocr]PPOCRLabel标注工具使用
如果用户想将内置模型更换为自己的推理模型,可根据。原创 2024-06-24 06:40:29 · 1001 阅读 · 0 评论 -
[paddleocr]ppstructure基于PaddleHub Serving的服务部署
如果需要修改服务逻辑,一般需要操作以下步骤(以修改为例):停止服务:到下的module.py和params.py等文件中根据实际需求修改代码。例如,如果需要替换部署服务所用模型,则需要到params.py中修改模型路径参数和,如果需要关闭文本方向分类器,则将参数置为False当然,同时可能还需要修改其他相关参数,请根据实际情况修改调试。强烈建议修改后先直接运行module.py调试,能正确运行预测后再启动服务测试。PPOCR-v3识别模型使用的图片输入shape为3,48,320,因此需要修改。原创 2024-06-24 06:38:58 · 900 阅读 · 0 评论 -
[paddleocr]ppstructure服务器端C++预测
本章节介绍PaddleOCR 模型的C++部署方法。C++在性能计算上优于Python,因此,在大多数CPU、GPU部署场景,多采用C++的部署方式,本节将介绍如何在Linux\Windows (CPU\GPU)环境下配置C++环境并完成PaddleOCR模型部署。原创 2024-06-24 06:37:53 · 1077 阅读 · 0 评论 -
[paddleocr]ppstructure基于Python预测引擎推理
目录下有一个同名目录,图片里的每个表格会存储为一个excel,图片区域会被裁剪之后保存下来,excel文件和图片名为表格在图片里的坐标。目录下有一个同名目录,图片区域会被裁剪之后保存下来,图片名为表格在图片里的坐标。目录下有一个同名目录,表格会存储为一个excel,excel文件名为。# 下载PP-StructureV2表格识别模型并解压。目录下有一个同名目录,目录中存放可视化图片和预测结果。目录下存放可视化之后的图片,图片名和输入图片名一致。# 下载PP-OCRv3文本识别模型并解压。原创 2024-06-24 06:36:20 · 735 阅读 · 0 评论 -
[paddocr]ppstructure关键信息抽取
关键信息抽取 (Key Information Extraction, KIE)指的是是从文本或者图像中,抽取出关键的信息。针对文档图像的关键信息抽取任务作为OCR的下游任务,存在非常多的实际应用场景,如表单识别、车票信息抽取、身份证信息抽取等。PP-Structure 基于 LayoutXLM 文档多模态系列方法进行研究与优化,设计了视觉特征无关的多模态模型结构VI-LayoutXLM,同时引入符合阅读顺序的文本行排序方法以及UDML联合互学习蒸馏方法,最终在精度与速度均超越LayoutXLM。集成。原创 2024-06-24 06:35:36 · 649 阅读 · 0 评论 -
[paddleocr]ppstructure表格识别
运行完成后,每张图片的excel表格会保存到output字段指定的目录下,同时在该目录下回生产一个html文件,用于可视化查看单元格坐标和识别的表格。gt每一行都由文件名和表格的html字符串组成,文件名和表格的html字符串之间使用。PP-Structure目前提供了中英文两种语言的表格识别模型,模型链接见。准备完成后使用如下命令进行评估,评估完成后会输出teds指标。下面以中文表格识别模型为例,介绍如何识别一张表格。文本识别模型的训练、评估和推理流程可参考。表格识别模型的训练、评估和推理流程可参考。原创 2024-06-24 06:34:11 · 865 阅读 · 0 评论 -
[paddleocr]ppstructure版面分析
版面分析指的是对图片形式的文档进行区域划分,定位其中的关键区域,如文字、标题、表格、图片等。版面分析算法基于的轻量模型PP-PicoDet进行开发,包含英文、中文、表格版面分析3类模型。原创 2024-06-24 06:30:57 · 1288 阅读 · 0 评论 -
[paddleocr]PP-OCR模型训练
本文将介绍模型训练时需掌握的基本概念,和训练时的调优方法。同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。原创 2024-06-24 06:29:27 · 606 阅读 · 0 评论 -
[paddleocr]PP-Structure 系列模型列表
在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。下载模型或者使用自己训练好的模型配置到。如需要使用其他OCR模型,可以在。原创 2024-06-24 06:28:42 · 807 阅读 · 0 评论 -
[paddleocr]PP-Structure 快速开始
字段指定的目录下有一个同名目录,图片里的每个表格会存储为一个excel,图片区域会被裁剪之后保存下来,excel文件和图片名为表格在图片里的坐标。通过本节内容,相信您已经熟练掌握通过PaddleOCR whl包调用PP-Structure相关功能的使用方法,您可以参考。# 安装 图像方向分类依赖包paddleclas(如不需要图像方向分类功能,可跳过)您的机器安装的是CUDA9或CUDA10,请运行以下命令安装。如果您没有基础的Python运行环境,请参考。您的机器是CPU,请运行以下命令安装。原创 2024-06-24 06:28:05 · 717 阅读 · 0 评论 -
[paddlocr]Paddle2ONNX模型转化与预测
本章节介绍 PaddleOCR 模型如何转化为 ONNX 模型,并基于 ONNXRuntime 引擎预测。原创 2024-06-24 06:26:55 · 988 阅读 · 0 评论 -
[paddleocr]PPOCR 服务化部署
与python pipeline服务不同,多模型串联的过程中需要将模型前后处理代码写在服务端,因此需要在本地重新编译生成serving。基于python的服务部署,显然具有二次开发便捷的优势,然而真正落地应用,往往需要追求更优的性能。接下来,用安装的paddle_serving_client把下载的inference模型转换成易于server部署的模型格式。使用PaddleServing做服务化部署时,需要将保存的inference模型转换为serving易于部署的模型。原创 2024-06-24 06:25:56 · 1033 阅读 · 0 评论 -
[paddleocr]基于Python引擎的PP-OCR模型库推理
本文介绍针对PP-OCR模型库的Python推理引擎使用方法,内容依次为文本检测、文本识别、方向分类器以及三者串联在CPU、GPU上的预测方法。原创 2024-06-24 06:22:27 · 860 阅读 · 0 评论 -
[paddleocr]服务器端C++预测
本章节介绍PaddleOCR 模型的C++部署方法。C++在性能计算上优于Python,因此,在大多数CPU、GPU部署场景,多采用C++的部署方式,本节将介绍如何在Linux\Windows (CPU\GPU)环境下配置C++环境并完成PaddleOCR模型部署。原创 2024-06-23 15:32:55 · 951 阅读 · 0 评论 -
[paddleocr]基于Python引擎的PP-OCR模型库推理
本文介绍针对PP-OCR模型库的Python推理引擎使用方法,内容依次为文本检测、文本识别、方向分类器以及三者串联在CPU、GPU上的预测方法。原创 2024-06-23 15:32:05 · 636 阅读 · 0 评论 -
[paddleocr]文本方向分类器训练
文本方向分类器主要用于图片非0度的场景下,在这种场景下需要对图片里检测到的文本行进行一个转正的操作。在PaddleOCR系统内, 文字检测之后得到的文本行图片经过仿射变换之后送入识别模型,此时只需要对文字进行一个0和180度的角度分类,因此PaddleOCR内置的 文本方向分类器只支持了0和180度的分类。如果想支持更多角度,可以自己修改算法进行支持。原创 2024-06-23 15:29:50 · 829 阅读 · 0 评论 -
[paddleocr]文字识别训练
训练集txt文件中默认请将图片路径和图片标签用 \t 分割,如用其他方式分割将造成训练报错。" 图像文件名 图像标注信息 "train_data/rec/train/word_001.jpg 简单可依赖train_data/rec/train/word_002.jpg 用科技让复杂的世界更简单...最终训练集应有如下文件结构:|-rec|- train| ...原创 2024-06-23 15:29:07 · 962 阅读 · 0 评论 -
[paddleocr]文字检测训练
本节以icdar2015数据集为例,介绍PaddleOCR中检测模型训练、评估、测试的使用方式。原创 2024-06-23 15:27:58 · 540 阅读 · 0 评论 -
[paddleocr]PP-OCR模型训练
本文将介绍模型训练时需掌握的基本概念,和训练时的调优方法。同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。原创 2024-06-23 15:27:13 · 943 阅读 · 0 评论 -
[paddleocr]PP-OCR系列模型列表
PaddleOCR提供的可下载模型包括推理模型训练模型预训练模型nb模型各个模型的关系如下面的示意图所示。原创 2024-06-23 15:26:26 · 1166 阅读 · 0 评论 -
[paddleocr]PaddleOCR 快速开始
本文主要介绍PaddleOCR wheel包对PP-OCR系列模型的快速使用,如要体验文档分析相关功能,请参考。原创 2024-06-23 15:25:00 · 854 阅读 · 0 评论