- 博客(147)
- 收藏
- 关注
原创 GhostNetv3的Re-parameterization
在GhostNetV3中,重参数化是一种在训练阶段引入的技术,用于提高模型性能,而在推理阶段则通过逆向重参数化过程去除多余的分支,以避免增加额外的计算成本。具体来说,在训练过程中,深度卷积和1×1卷积中引入了线性并行分支,这些分支在训练后可以重新参数化,在推理时不会带来额外的成本。这是因为卷积和BatchNorm运算在推理过程中都是线性的,可以折叠成单个卷积层,其权重矩阵和偏置可以重参数化为所有分支的权重和偏置的总和。在推理时,通过逆向重参数化过程,可以删除重复的分支。
2024-08-06 11:25:55 177
原创 引导Kim生产学习计划
首先,我们定义一个组件接口,所有的文件和文件夹都将实现这个接口。public:首先定义一个组件接口,它是文件系统层次结构中的所有元素的基类。public:// 虚拟析构函数,确保派生类的析构函数被调用// 向文件系统中添加一个元素// 从文件系统中移除一个元素// 获取文件系统中的一个子元素// 显示元素信息,例如用于打印文件系统树。
2024-08-05 15:15:48 794
原创 java 实现人脸特征提取和比对
dlib通常会自动检测系统上的JPEG、BLAS和LAPACK库。如果你已经安装了这些库,dlib应该能够自动找到并使用它们。确保你已经安装了JPEG库、BLAS和LAPACK库。
2024-07-08 18:02:31 634
原创 java 实现人脸检测
dlib通常会自动检测系统上的JPEG、BLAS和LAPACK库。如果你已经安装了这些库,dlib应该能够自动找到并使用它们。确保你已经安装了JPEG库、BLAS和LAPACK库。
2024-07-08 14:31:01 351
原创 OCR text detect
HGNet 作者针对 GPU 设备,对目前 GPU 友好的网络做了分析和归纳,尽可能多的使用 3x3 标准卷积(计算密度最高)。在此将 VOVNet 作为基准模型,将主要的有利于 GPU 推理的改进点进行融合。VoVNet 通过引入 OSA(One-Shot Aggregation)模块来优化特征提取过程,提高了网络的效率和性能。PP-HGNetV2 是 PP-HGNetV1 的改进版本,在多个方面进行了优化和增强,以提高模型的性能和效率。
2024-07-03 17:05:32 1060
原创 Paddleocr数据增强调用逻辑
每一个op是eval(op_name)(**param),eval() 函数将字符串 expression 解析为 Python 表达式,并在指定的命名空间中执行它。get_ext_data通过self.ops[:self.ext_op_transform_idx]获取配置文件中数据增强。通过ppocr/data/imaug/__init__.py,eval()可以调用CopyPaste实现数据增强。然后调用 data = transform(data, load_data_ops)实现数据增强。
2024-06-18 11:40:59 368
原创 paddleocr实验过程
切割后的数据在train_data中,注意切割后的数据前缀默认是当前目录,因此建议切割数据在liunx中进行。或者修改下面--datasetRootPath中的default。如果在Win中切割,放入liunx中训练。1、打开tmux窗口启动,这样断开连接后台可以继续训练。2、根据需求修改配置文件,如输出名称,数据集位置,注意暂时不要改吧epoch,训练容易报错。建议在liunx中指定。
2024-06-11 18:07:33 512
原创 yolov5导出onnx转engine推理
使用上述文章中的代码ONNX转engine速度较慢, engine_file_path需要给出具体名称,如:yolov5_my.engine。pt转engine是先转ONNX,然后再到engine。将TensorRT的的lib加入环境变量中。需要提供配置文件和权重文件,不然导出模型不能正常推理。在win11系统环境path添加。
2024-02-22 10:49:11 1498
原创 yolov5三种TensorRT推理过程
4、把生成的yolov5l_best.wts文件导入\tensorrtx-yolov5-v5.0\yolov5\build\Release文件下,使用指 令yolov5.exe -s yolov5l_best.wts yolov5l_best.engine l 通过yolov5.exe生成yolov5l best.engine,参数l根据训练模型来改,可以是s\m\I\x。
2024-02-20 14:59:04 656
原创 pip安装paddlepaddle报错ERROR: Could not install packages due to an OSError
这个问题是由于Windows系统路径长度限制导致的。在Windows中,单个文件路径的最大长度有限制(默认为260个字符),这可能会在你尝试安装某些Python包时导致问题,特别是当这些包的路径非常深或包含许多子目录时。
2024-02-19 17:20:38 1199
原创 目标检测一般性问题
是衡量二分类模型精度的一种指标,兼顾了分类模型的精确率和召回率。它是精确率和召回率的调和平均数,最大为1,最小为0。但是还要考虑模型的泛化能力,F1-score过高但不能造成过拟合,影响模型的泛化能力。IoU也称作交并比,评价边界框正确性的度量指标,表示detection box(检测框)与ground truth(真实标签)的交集和并集的比值。FP:IoU
2024-02-18 11:20:33 595
原创 人生有感触才能对话苏东波
苏轼诗和词的表面不是他高度的提现,背后折射他对当时处境的态度才是千百年来人们对他的喜爱和追捧。想来我在这个年纪也是什么都说不出来,小时候这个园子还不是免费的,每次路过门口,我最好奇的是门口的两个石狮子嘴里的球是怎么放进去的的。后来园子开放了,来了好几次,想在这个不大的园子里看看有没有新发现,当然,还会背几首苏轼的诗词满足自己爱炫耀的虚荣心。看完纪录片千古风流人物后,这些千古留名的大人物的才华,家室,地位在当时都是普通人望尘莫及的,但是他们的一生中总有各种遗憾,其中那些有着远大抱负的人,大抵都是郁郁不得志。
2024-02-14 21:13:14 362
原创 Failed to build lap ERROR: Could not build wheels for lap, which is required to install pyproject.to
pip安装paddledet,报错。
2024-02-01 14:10:21 908
原创 关于paddleocr的predict_system按高度顺序画图
关于paddleocr的predict_system按高度顺序画图,(coco格式)
2024-01-30 13:45:52 489
原创 Citrix找不到ICAWebWrapper.msi所在的文件夹的路径
首先解压Citrix Receiver.exe,然后在里面找到。这个东西,将放入上图中找不到的路径下可以解决这个上述问题。在Citrix Workspace启动虚拟机是出现。
2024-01-10 10:43:23 1373
原创 关于json.dumps()写入文件时是utf8
json.dumps()中设置ensure_ascii=False,结合open函数中的encoding='utf-8',json.dumps()默认情况下,该函数会自动处理Unicode编码。不要直接在json.dumps()设置encoding='utf-8',
2024-01-09 13:30:20 1762
原创 paddleocr文字识别变迁
对于标准的 DML 策略,蒸馏的损失函数仅包括最后输出层监督,然而对于 2 个结构完全相同的模型来说,对 于完全相同的输入,它们的中间特征输出期望也完全相同,因此在最后输出层监督的监督上,可以进一步添 加中间输出的特征图的监督信号,作为损失函数,即 PP-OCRv2 中的 U-DML (Unified-Deep Mutual Learning) 知识蒸馏方法。在L2正则化的帮助下, 网络的权重趋向于选择一个较小的值,最终整个网络中的参数趋向于0,从而缓解模型的过拟合问题,提高 了模型的泛化性能。
2023-12-06 10:49:01 1284
原创 paddleocr文本检测改进变迁
知识蒸馏的方法在部署中非常常用,通过使用大模型指导小模型学习的方式,在通常情况下可以使得小模型 在预测耗时不变的情况下,精度得到进一步的提升,从而进一步提升实际部署的体验。标准的蒸馏方法是通过一个大模型作为 Teacher 模型来指导 Student 模型提升效果,而后来又发展出 DML 互 学习蒸馏方法,即通过两个结构相同的模型互相学习,相比于前者,DML 脱离了对大的 Teacher 模型的依赖, 蒸馏训练的流程更加简单,模型产出效率也要更高一些。FPGM与基于范数的裁剪算法的对比如下图所示。
2023-12-04 17:46:36 1332
原创 paddleocr笔记
版面分析任务中,图像首先经过版面分析模型,将图像划分为文本、表格、图像等不同区域,随后对这些区域分别进行识别,如,将表格区域送入表格识别模块进行结构化识别,将文本区域送入OCR引擎进行文字识别,最后使用版面恢复模块将其恢复为与原始图像布局一致的word或者pdf格式的文件;关键信息抽取任务中,首先使用OCR引擎提取文本内容,然后由语义实体识别模块获取图像中的语义实体,最后经关系抽取模块获取语义实体之间的对应关系,从而提取需要的关键信息。从算法改进思路来看,对系统中的3个关键子模块,共进行了8个方面的改进。
2023-11-27 15:50:22 2612
原创 opencv4笔记
它的成立条件是假设直方图最大波峰在靠近最亮的一侧,然后通过三角形求得最大直线距离,根据最大直线距离对应的直方图灰度等级即为分割阈值。,计算简单,不受图像亮度和对比度的影响,它是按图像的灰度特性,将图像分成背景和前景两部分。,当部分前景错分为背景或部分背景错分为前景都会导致两部分差别变小。适用于光照不均衡以及更加复杂的情况下。,由大津于1979年提出,被认为是。大津法OSTU阈值类型——该方法是使用直方图数据,
2023-11-09 11:33:12 383
原创 对比学习(contrastive Learning)
自监督学习又可以分为对比学习(contrastive learning)和生成学习(generative learning)两条主要的技术路线。比学习的核心思想是将正样本和负样本在特征空间对比,从而学习样本的特征表示,使得样本与正样本的特征表示尽可能接近。正样本和负样本是使用代理任务(pretext task)来定义的. 代理任务定义了样本之间的相似性,给定一个样本,与之相似的样本就是正样本,而不相似的样本就是负样本.。
2023-11-02 10:59:12 411
原创 win yolov5.7 tensorRT部署推理
在debug下报错:错误 LNK1104 无法打开文件“python310_d.lib”环境中没有安装python的debug版本,换成release环境。找到TensorRT-8.6.1.6\python/python/tensorrt-8.6.1-cp39-none-win_amd64.whl。下载tensorrt8.xx版本,适用于Windows的cuda11.x的版本。torch的版本要和CUDA一致,CUDA是11.7,
2023-10-20 10:19:05 173
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人