自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(147)
  • 收藏
  • 关注

原创 标注:ppocr转YOLOv5

【代码】标注:ppocr转YOLOv5。

2024-08-19 20:17:01 118

原创 GhostNetv3的Re-parameterization

在GhostNetV3中,重参数化是一种在训练阶段引入的技术,用于提高模型性能,而在推理阶段则通过逆向重参数化过程去除多余的分支,以避免增加额外的计算成本。具体来说,在训练过程中,深度卷积和1×1卷积中引入了线性并行分支,这些分支在训练后可以重新参数化,在推理时不会带来额外的成本。这是因为卷积和BatchNorm运算在推理过程中都是线性的,可以折叠成单个卷积层,其权重矩阵和偏置可以重参数化为所有分支的权重和偏置的总和。在推理时,通过逆向重参数化过程,可以删除重复的分支。

2024-08-06 11:25:55 175

原创 引导Kim生产学习计划

首先,我们定义一个组件接口,所有的文件和文件夹都将实现这个接口。public:首先定义一个组件接口,它是文件系统层次结构中的所有元素的基类。public:// 虚拟析构函数,确保派生类的析构函数被调用// 向文件系统中添加一个元素// 从文件系统中移除一个元素// 获取文件系统中的一个子元素// 显示元素信息,例如用于打印文件系统树。

2024-08-05 15:15:48 782

原创 liunx常用命令

【代码】liunx常用命令。

2024-08-05 09:36:55 99

原创 Ubuntu安装opencv4.x

【代码】Ubuntu安装opencv4.x。

2024-07-18 20:24:03 155

原创 java 实现人脸特征提取和比对

dlib通常会自动检测系统上的JPEG、BLAS和LAPACK库。如果你已经安装了这些库,dlib应该能够自动找到并使用它们。确保你已经安装了JPEG库、BLAS和LAPACK库。

2024-07-08 18:02:31 614

原创 java 实现人脸检测

dlib通常会自动检测系统上的JPEG、BLAS和LAPACK库。如果你已经安装了这些库,dlib应该能够自动找到并使用它们。确保你已经安装了JPEG库、BLAS和LAPACK库。

2024-07-08 14:31:01 345

原创 ubuntu dlib的cpu编译

【代码】ubuntu dlib的cpu编译。

2024-07-05 14:29:37 116

原创 OCR text detect

HGNet 作者针对 GPU 设备,对目前 GPU 友好的网络做了分析和归纳,尽可能多的使用 3x3 标准卷积(计算密度最高)。在此将 VOVNet 作为基准模型,将主要的有利于 GPU 推理的改进点进行融合。VoVNet 通过引入 OSA(One-Shot Aggregation)模块来优化特征提取过程,提高了网络的效率和性能。PP-HGNetV2 是 PP-HGNetV1 的改进版本,在多个方面进行了优化和增强,以提高模型的性能和效率。

2024-07-03 17:05:32 1044

原创 Paddleocr数据增强调用逻辑

每一个op是eval(op_name)(**param),eval() 函数将字符串 expression 解析为 Python 表达式,并在指定的命名空间中执行它。get_ext_data通过self.ops[:self.ext_op_transform_idx]获取配置文件中数据增强。通过ppocr/data/imaug/__init__.py,eval()可以调用CopyPaste实现数据增强。然后调用 data = transform(data, load_data_ops)实现数据增强。

2024-06-18 11:40:59 362

原创 PP-OCRv4中epoch设置小于500后会出现数据报错

【代码】PP-OCRv4中epoch设置小于500后会出现数据报错。

2024-06-12 16:54:34 203 3

原创 paddleocr实验过程

切割后的数据在train_data中,注意切割后的数据前缀默认是当前目录,因此建议切割数据在liunx中进行。或者修改下面--datasetRootPath中的default。如果在Win中切割,放入liunx中训练。1、打开tmux窗口启动,这样断开连接后台可以继续训练。2、根据需求修改配置文件,如输出名称,数据集位置,注意暂时不要改吧epoch,训练容易报错。建议在liunx中指定。

2024-06-11 18:07:33 503

原创 OCR test rec

【代码】OCR test rec。

2024-06-06 20:29:21 104

原创 paddleocr det部分的数据增强参数

【代码】paddleocr det部分的数据增强参数。

2024-05-27 14:59:57 173

原创 Fastapi参数说明

【代码】Fastapi参数说明。

2024-03-18 11:40:51 509

原创 qwen API调用

【代码】qwen API调用。

2024-03-11 22:20:44 1718

原创 python循环读取写入Excel

【代码】python循环读取写入Excel。

2024-03-11 14:37:33 604

原创 yolov5导出onnx转engine推理

使用上述文章中的代码ONNX转engine速度较慢, engine_file_path需要给出具体名称,如:yolov5_my.engine。pt转engine是先转ONNX,然后再到engine。将TensorRT的的lib加入环境变量中。需要提供配置文件和权重文件,不然导出模型不能正常推理。在win11系统环境path添加。

2024-02-22 10:49:11 1478

原创 yolov5三种TensorRT推理过程

4、把生成的yolov5l_best.wts文件导入\tensorrtx-yolov5-v5.0\yolov5\build\Release文件下,使用指 令yolov5.exe -s yolov5l_best.wts yolov5l_best.engine l 通过yolov5.exe生成yolov5l best.engine,参数l根据训练模型来改,可以是s\m\I\x。

2024-02-20 14:59:04 651

原创 基于Python的paddleocr推理环境列表

基于Python的paddleocr推理环境列表,

2024-02-19 17:22:47 521

原创 pip安装paddlepaddle报错ERROR: Could not install packages due to an OSError

这个问题是由于Windows系统路径长度限制导致的。在Windows中,单个文件路径的最大长度有限制(默认为260个字符),这可能会在你尝试安装某些Python包时导致问题,特别是当这些包的路径非常深或包含许多子目录时。

2024-02-19 17:20:38 1186

原创 目标检测一般性问题

是衡量二分类模型精度的一种指标,兼顾了分类模型的精确率和召回率。它是精确率和召回率的调和平均数,最大为1,最小为0。但是还要考虑模型的泛化能力,F1-score过高但不能造成过拟合,影响模型的泛化能力。IoU也称作交并比,评价边界框正确性的度量指标,表示detection box(检测框)与ground truth(真实标签)的交集和并集的比值。FP:IoU

2024-02-18 11:20:33 593

原创 人生有感触才能对话苏东波

苏轼诗和词的表面不是他高度的提现,背后折射他对当时处境的态度才是千百年来人们对他的喜爱和追捧。想来我在这个年纪也是什么都说不出来,小时候这个园子还不是免费的,每次路过门口,我最好奇的是门口的两个石狮子嘴里的球是怎么放进去的的。后来园子开放了,来了好几次,想在这个不大的园子里看看有没有新发现,当然,还会背几首苏轼的诗词满足自己爱炫耀的虚荣心。看完纪录片千古风流人物后,这些千古留名的大人物的才华,家室,地位在当时都是普通人望尘莫及的,但是他们的一生中总有各种遗憾,其中那些有着远大抱负的人,大抵都是郁郁不得志。

2024-02-14 21:13:14 361

原创 PP-PicoDet注意版面分析模型的结果导出

使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。

2024-02-02 15:02:56 505

原创 阿里云a10GPU,centos7,cuda11.2环境配置

【代码】阿里云a10GPU,centos7,cuda11.2环境配置。

2024-02-02 14:26:57 1038

原创 centos gcc4.8升级8

【代码】centos gcc4.8升级8。

2024-02-01 14:22:03 789

原创 Failed to build lap ERROR: Could not build wheels for lap, which is required to install pyproject.to

pip安装paddledet,报错。

2024-02-01 14:10:21 894

原创 关于paddleocr的predict_system按高度顺序画图

关于paddleocr的predict_system按高度顺序画图,(coco格式)

2024-01-30 13:45:52 487

原创 PaddleDetection的推理图像发生旋转

读取时发生旋转,修改一下代码。

2024-01-28 17:41:11 741

原创 Citrix找不到ICAWebWrapper.msi所在的文件夹的路径

首先解压Citrix Receiver.exe,然后在里面找到。这个东西,将放入上图中找不到的路径下可以解决这个上述问题。在Citrix Workspace启动虚拟机是出现。

2024-01-10 10:43:23 1332

原创 使用python获取URL图像

使用python获取URL图像。

2024-01-09 17:43:11 587

原创 读取程序所在位置

希望在不同目录下调用python程序,不会影响程序中模型的调用。这样无论从哪里调用程序都不会影响程序内部调用外部模型。

2024-01-09 17:38:26 308

原创 关于json.dumps()写入文件时是utf8

json.dumps()中设置ensure_ascii=False,结合open函数中的encoding='utf-8',json.dumps()默认情况下,该函数会自动处理Unicode编码。不要直接在json.dumps()设置encoding='utf-8',

2024-01-09 13:30:20 1714

原创 paddleocr文字识别变迁

对于标准的 DML 策略,蒸馏的损失函数仅包括最后输出层监督,然而对于 2 个结构完全相同的模型来说,对 于完全相同的输入,它们的中间特征输出期望也完全相同,因此在最后输出层监督的监督上,可以进一步添 加中间输出的特征图的监督信号,作为损失函数,即 PP-OCRv2 中的 U-DML (Unified-Deep Mutual Learning) 知识蒸馏方法。在L2正则化的帮助下, 网络的权重趋向于选择一个较小的值,最终整个网络中的参数趋向于0,从而缓解模型的过拟合问题,提高 了模型的泛化性能。

2023-12-06 10:49:01 1274

原创 paddleocr文本检测改进变迁

知识蒸馏的方法在部署中非常常用,通过使用大模型指导小模型学习的方式,在通常情况下可以使得小模型 在预测耗时不变的情况下,精度得到进一步的提升,从而进一步提升实际部署的体验。标准的蒸馏方法是通过一个大模型作为 Teacher 模型来指导 Student 模型提升效果,而后来又发展出 DML 互 学习蒸馏方法,即通过两个结构相同的模型互相学习,相比于前者,DML 脱离了对大的 Teacher 模型的依赖, 蒸馏训练的流程更加简单,模型产出效率也要更高一些。FPGM与基于范数的裁剪算法的对比如下图所示。

2023-12-04 17:46:36 1324

原创 paddleocr笔记

版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入OCR引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的word或者pdf格式的文件;关键信息抽取任务中,首先使用OCR引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。从算法改进思路来看,对系统中的3个关键子模块,共进行了8个方面的改进。

2023-11-27 15:50:22 2583

原创 paddleocr的cpp_infer在Liunx下编译部署

【代码】paddleocr的cpp_infer在Liunx下编译部署。

2023-11-22 15:03:20 1110

原创 opencv4笔记

它的成立条件是假设直方图最大波峰在靠近最亮的一侧,然后通过三角形求得最大直线距离,根据最大直线距离对应的直方图灰度等级即为分割阈值。,计算简单,不受图像亮度和对比度的影响,它是按图像的灰度特性,将图像分成背景和前景两部分。,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。适用于光照不均衡以及更加复杂的情况下。,由大津于1979年提出,被认为是。大津法OSTU阈值类型——该方法是使用直方图数据,

2023-11-09 11:33:12 381

原创 对比学习(contrastive Learning)

自监督学习又可以分为对比学习(contrastive learning)和生成学习(generative learning)两条主要的技术路线。比学习的核心思想是将正样本和负样本在特征空间对比,从而学习样本的特征表示,使得样本与正样本的特征表示尽可能接近。正样本和负样本是使用代理任务(pretext task)来定义的. 代理任务定义了样本之间的相似性,给定一个样本,与之相似的样本就是正样本,而不相似的样本就是负样本.。

2023-11-02 10:59:12 408

原创 win yolov5.7 tensorRT部署推理

在debug下报错:错误 LNK1104 无法打开文件“python310_d.lib”环境中没有安装python的debug版本,换成release环境。找到TensorRT-8.6.1.6\python/python/tensorrt-8.6.1-cp39-none-win_amd64.whl。下载tensorrt8.xx版本,适用于Windows的cuda11.x的版本。torch的版本要和CUDA一致,CUDA是11.7,

2023-10-20 10:19:05 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除