自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 船舶检测数据集VOC+YOLO格式7000张6类别

标注类别名称:["bulk cargo carrier","container ship","fishing boat","general cargo ship","ore carrier","passenger ship"]数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注。标注数量(txt文件个数):7000。

2024-08-16 19:07:05 99

原创 [软件工具]随机地址生成工具极速版使用教程

在快节奏的生活中,无论是填写问卷、注册账号还是保护个人隐私,一个安全、快速的地址生成工具都是不可或缺的。我们精心打造的“极速版随机地址生成器”,一键快速生成随机地址,支持导出TXT或者excel格式,可以方便后续处理和二次加工。无需繁琐操作,无需等待,只需轻轻一点,即可获得一个全新的、完全随机的地址信息。无论是网络冲浪的匿名需求,还是工作学习的便捷辅助,“极速版随机地址生成器”都是您的不二之选。让繁琐变得简单,让安全成为习惯,立即体验,开启您的便捷生活新篇章!选择具体省市区即可生成非常简单的操作。

2024-08-06 14:37:35 661

原创 随机地址生成软件使用教程

(3)软件采用精准的模拟生成,但是不是实际的。

2024-08-05 10:02:06 316

原创 [数据集][目标检测]变电站缺陷检测数据集VOC+YOLO格式8307张17类别

标注类别名称:[“bj_bpmh”,“bj_bpps”,“bj_wkps”,“bjdsyc”,“gbps”,“hxq_gjbs”,“hxq_gjtps”,“jyz_pl”,“kgg_ybh”,“sly_dmyw”,“wcaqm”,“wcgz”,“xmbhyc”,“xy”,“yw_gkxfw”,“yw_nc”,“ywzt_yfyc”]格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)

2024-08-03 22:06:37 308

原创 [cmake]cmake安装包国内地址下载汇总

易于使用:通过编写简单的配置文件(CMakeLists.txt),开发者可以描述软件的编译过程,CMake会根据这些配置文件自动生成适应不同平台的构建文件,如Makefile、Visual Studio项目文件等。综上所述,CMake是一个功能强大、易于使用的跨平台构建系统,它极大地简化了软件项目的构建和管理过程,是现代软件开发中不可或缺的工具之一。支持复杂项目:CMake支持大型项目和复杂依赖关系的管理,能够处理多个子目录和模块,以及自动生成必要的构建文件。linux_x86_64版本。

2024-08-02 08:20:59 335

原创 [数据集][目标检测]齿轮缺陷检测数据集VOC+YOLO格式2978张3类别

数据集格式:Pascal VOC格式+YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)特别声明:本数据集不对训练的模型或者权重文件精度作任何保证,数据集只提供准确且合理标注。标注类别名称:["break","lack","scratch"]图片数量(jpg文件个数):2978。标注数量(xml文件个数):2978。标注数量(txt文件个数):2978。使用标注工具:labelImg。标注规则:对类别进行画矩形框。

2024-07-24 05:41:52 263

原创 [paddleocr]前沿算法与模型

SAST模型训练额外加入了icdar2013、icdar2017、COCO-Text、ArT等公开数据集进行调优。

2024-06-25 07:30:39 1052

原创 [paddleocr]知识蒸馏

近年来,深度神经网络在计算机视觉、自然语言处理等领域被验证是一种极其有效的解决问题的方法。通过构建合适的神经网络,加以训练,最终网络模型的性能指标基本上都会超过传统算法。在数据量足够大的情况下,通过合理构建网络模型的方式增加其参数量,可以显著改善模型性能,但是这又带来了模型复杂度急剧提升的问题。大模型在实际场景中使用的成本较高。深度神经网络一般有较多的参数冗余,目前有几种主要的方法对模型进行压缩,减小其参数量。

2024-06-25 07:29:42 861

原创 [paddleocr]PP-OCR模型裁剪

复杂的模型有利于提高模型的性能,但也导致模型中存在一定冗余,模型裁剪通过移出网络模型中的子模型来减少这种冗余,达到减少模型计算复杂度,提高模型推理性能的目的。本教程将介绍如何使用飞桨模型压缩库PaddleSlim做PaddleOCR模型的压缩。集成了模型剪枝、量化(包括量化训练和离线量化)、蒸馏和神经网络搜索等多种业界常用且领先的模型压缩功能,如果您感兴趣,可以关注并了解。

2024-06-25 07:28:53 990

原创 [paddlocr]PP-OCR模型量化

复杂的模型有利于提高模型的性能,但也导致模型中存在一定冗余,模型量化将全精度缩减到定点数减少这种冗余,达到减少模型计算复杂度,提高模型推理性能的目的。模型量化可以在基本不损失模型的精度的情况下,将FP32精度的模型参数转换为Int8精度,减小模型参数大小并加速计算,使用量化后的模型在移动端等部署时更具备速度优势。本教程将介绍如何使用飞桨模型压缩库PaddleSlim做PaddleOCR模型的压缩。

2024-06-25 07:28:19 789

原创 [paddleocr]其它数据标注工具

这里整理了常用的数据标注工具,持续更新中,欢迎各位小伙伴贡献工具~

2024-06-24 06:44:33 386

原创 [paddleocr]数据合成工具 Style-Text

Style-Text数据合成工具是基于百度和华科合作研发的文本编辑算法《Editing Text in the Wild》不同于常用的基于GAN的数据合成工具,Style-Text主要框架包括:1.文本前景风格迁移模块 2.背景抽取模块 3.融合模块。经过这样三步,就可以迅速实现图像文本风格迁移。下图是一些该数据合成工具效果图。

2024-06-24 06:41:22 1131

原创 [paddleocr]PPOCRLabel标注工具使用

如果用户想将内置模型更换为自己的推理模型,可根据。

2024-06-24 06:40:29 1390

原创 [paddleocr]ppstructure基于PaddleHub Serving的服务部署

如果需要修改服务逻辑,一般需要操作以下步骤(以修改为例):停止服务:到下的module.py和params.py等文件中根据实际需求修改代码。例如,如果需要替换部署服务所用模型,则需要到params.py中修改模型路径参数和,如果需要关闭文本方向分类器,则将参数置为False当然,同时可能还需要修改其他相关参数,请根据实际情况修改调试。强烈建议修改后先直接运行module.py调试,能正确运行预测后再启动服务测试。PPOCR-v3识别模型使用的图片输入shape为3,48,320,因此需要修改。

2024-06-24 06:38:58 1038

原创 [paddleocr]ppstructure服务器端C++预测

本章节介绍PaddleOCR 模型的C++部署方法。C++在性能计算上优于Python,因此,在大多数CPU、GPU部署场景,多采用C++的部署方式,本节将介绍如何在Linux\Windows (CPU\GPU)环境下配置C++环境并完成PaddleOCR模型部署。

2024-06-24 06:37:53 1123

原创 [paddleocr]ppstructure基于Python预测引擎推理

目录下有一个同名目录,图片里的每个表格会存储为一个excel,图片区域会被裁剪之后保存下来,excel文件和图片名为表格在图片里的坐标。目录下有一个同名目录,图片区域会被裁剪之后保存下来,图片名为表格在图片里的坐标。目录下有一个同名目录,表格会存储为一个excel,excel文件名为。# 下载PP-StructureV2表格识别模型并解压。目录下有一个同名目录,目录中存放可视化图片和预测结果。目录下存放可视化之后的图片,图片名和输入图片名一致。# 下载PP-OCRv3文本识别模型并解压。

2024-06-24 06:36:20 807

原创 [paddocr]ppstructure关键信息抽取

关键信息抽取 (Key Information Extraction, KIE)指的是是从文本或者图像中,抽取出关键的信息。针对文档图像的关键信息抽取任务作为OCR的下游任务,存在非常多的实际应用场景,如表单识别、车票信息抽取、身份证信息抽取等。PP-Structure 基于 LayoutXLM 文档多模态系列方法进行研究与优化,设计了视觉特征无关的多模态模型结构VI-LayoutXLM,同时引入符合阅读顺序的文本行排序方法以及UDML联合互学习蒸馏方法,最终在精度与速度均超越LayoutXLM。集成。

2024-06-24 06:35:36 745

原创 [paddleocr]ppstructure表格识别

运行完成后,每张图片的excel表格会保存到output字段指定的目录下,同时在该目录下回生产一个html文件,用于可视化查看单元格坐标和识别的表格。gt每一行都由文件名和表格的html字符串组成,文件名和表格的html字符串之间使用。PP-Structure目前提供了中英文两种语言的表格识别模型,模型链接见。准备完成后使用如下命令进行评估,评估完成后会输出teds指标。下面以中文表格识别模型为例,介绍如何识别一张表格。文本识别模型的训练、评估和推理流程可参考。表格识别模型的训练、评估和推理流程可参考。

2024-06-24 06:34:11 1306

原创 [paddleocr]ppstructure版面分析

版面分析指的是对图片形式的文档进行区域划分,定位其中的关键区域,如文字、标题、表格、图片等。版面分析算法基于的轻量模型PP-PicoDet进行开发,包含英文、中文、表格版面分析3类模型。

2024-06-24 06:30:57 1500

原创 [paddleocr]PP-OCR模型训练

本文将介绍模型训练时需掌握的基本概念,和训练时的调优方法。同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。

2024-06-24 06:29:27 661

原创 [paddleocr]PP-Structure 系列模型列表

在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。下载模型或者使用自己训练好的模型配置到。如需要使用其他OCR模型,可以在。

2024-06-24 06:28:42 843

原创 [paddleocr]PP-Structure 快速开始

字段指定的目录下有一个同名目录,图片里的每个表格会存储为一个excel,图片区域会被裁剪之后保存下来,excel文件和图片名为表格在图片里的坐标。通过本节内容,相信您已经熟练掌握通过PaddleOCR whl包调用PP-Structure相关功能的使用方法,您可以参考。# 安装 图像方向分类依赖包paddleclas(如不需要图像方向分类功能,可跳过)您的机器安装的是CUDA9或CUDA10,请运行以下命令安装。如果您没有基础的Python运行环境,请参考。您的机器是CPU,请运行以下命令安装。

2024-06-24 06:28:05 814

原创 [paddlocr]Paddle2ONNX模型转化与预测

本章节介绍 PaddleOCR 模型如何转化为 ONNX 模型,并基于 ONNXRuntime 引擎预测。

2024-06-24 06:26:55 1248

原创 [paddleocr]PPOCR 服务化部署

与python pipeline服务不同,多模型串联的过程中需要将模型前后处理代码写在服务端,因此需要在本地重新编译生成serving。基于python的服务部署,显然具有二次开发便捷的优势,然而真正落地应用,往往需要追求更优的性能。接下来,用安装的paddle_serving_client把下载的inference模型转换成易于server部署的模型格式。使用PaddleServing做服务化部署时,需要将保存的inference模型转换为serving易于部署的模型。

2024-06-24 06:25:56 1157

原创 [paddleocr]基于Python引擎的PP-OCR模型库推理

本文介绍针对PP-OCR模型库的Python推理引擎使用方法,内容依次为文本检测、文本识别、方向分类器以及三者串联在CPU、GPU上的预测方法。

2024-06-24 06:22:27 935

原创 [paddleocr]服务器端C++预测

本章节介绍PaddleOCR 模型的C++部署方法。C++在性能计算上优于Python,因此,在大多数CPU、GPU部署场景,多采用C++的部署方式,本节将介绍如何在Linux\Windows (CPU\GPU)环境下配置C++环境并完成PaddleOCR模型部署。

2024-06-23 15:32:55 1060

原创 [paddleocr]基于Python引擎的PP-OCR模型库推理

本文介绍针对PP-OCR模型库的Python推理引擎使用方法,内容依次为文本检测、文本识别、方向分类器以及三者串联在CPU、GPU上的预测方法。

2024-06-23 15:32:05 658

原创 [paddleocr]文本方向分类器训练

文本方向分类器主要用于图片非0度的场景下,在这种场景下需要对图片里检测到的文本行进行一个转正的操作。在PaddleOCR系统内, 文字检测之后得到的文本行图片经过仿射变换之后送入识别模型,此时只需要对文字进行一个0和180度的角度分类,因此PaddleOCR内置的 文本方向分类器只支持了0和180度的分类。如果想支持更多角度,可以自己修改算法进行支持。

2024-06-23 15:29:50 914

原创 [paddleocr]文字识别训练

训练集txt文件中默认请将图片路径和图片标签用 \t 分割,如用其他方式分割将造成训练报错。" 图像文件名 图像标注信息 "train_data/rec/train/word_001.jpg 简单可依赖train_data/rec/train/word_002.jpg 用科技让复杂的世界更简单...最终训练集应有如下文件结构:|-rec|- train| ...

2024-06-23 15:29:07 1105

原创 [paddleocr]文字检测训练

本节以icdar2015数据集为例,介绍PaddleOCR中检测模型训练、评估、测试的使用方式。

2024-06-23 15:27:58 576

原创 [paddleocr]PP-OCR模型训练

本文将介绍模型训练时需掌握的基本概念,和训练时的调优方法。同时会简单介绍PaddleOCR模型训练数据的组成部分,以及如何在垂类场景中准备数据finetune模型。

2024-06-23 15:27:13 988

原创 [paddleocr]PP-OCR系列模型列表

PaddleOCR提供的可下载模型包括推理模型训练模型预训练模型nb模型各个模型的关系如下面的示意图所示。

2024-06-23 15:26:26 1300

原创 [paddleocr]PaddleOCR 快速开始

本文主要介绍PaddleOCR wheel包对PP-OCR系列模型的快速使用,如要体验文档分析相关功能,请参考。

2024-06-23 15:25:00 919

BAproducetracker-0.0.2-py3-none-any.whl

BAproducetracker-0.0.2-py3-none-any.whl

2016-05-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除