- 博客(32)
- 资源 (4)
- 收藏
- 关注
原创 如何用mmclassification训练多标签多分类数据
我这里只是增加了一些度量函数,方便可视化多标签的指标情况,并没有更新其他地方,训练时还是会验证原来的指标,里面调用的Metric类可以参考这篇文章:https://blog.csdn.net/u013250861/article/details/122727704。训练数据标签文件格式如下,每行的空格前面是路径(图像文件所在的绝对路径),后面是标签名,因为特殊要求这里我的每张图像都记录了三个标签每个标签用“,”分开(具体看自己的需求),我的训练标签数量是17个。
2024-10-23 18:03:13 625
原创 yolov8图像分类推理程序的预处理步骤抽取出来-纯代码-干货分享
•将图像从 (H, W, C) 转换为 (C, H, W) 格式。官网文档:https://docs.ultralytics.com/zh/models/yolov8/•new_shape 是目标尺寸,color 是填充颜色,默认为灰色 (114, 114, 114)。•将图像从 BGR 转换为 RGB 格式。•将像素值归一化到 [0, 1] 范围。•读取图像并调用 letterbox_image 函数进行调整大小和填充。•该函数用于调整图像大小并保持宽高比,同时在图像周围添加黑色填充。
2024-10-15 15:59:06 184
原创 使用from torchinfo import summary 查看网络结构
分享一个好用的查看网络结构的工具,从ghostnet的源码中看见的,其他的网络结构换个函数就行。用到你的程序里面试试吧!
2024-10-14 15:28:53 151
原创 【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV3步骤详解
这里yolov8源码版本是 ultralytics-8.2.54GhostNetV3 源码下载 https://codeload.github.com/huawei-noah/Efficient-AI-Backbones将ghostnetv3.py文件复制一份到源码./ultralytics-8.2.54/ultralytics/nn/modules路径下我根据mobilenetv4的教程,修改了ghostnetv3.py文件的以下部分:class GhostNet(nn.Module):
2024-10-12 15:36:10 398 2
原创 Agent:原理与快速构建 | 人工智能 | Langchain | Python ——学习笔记
视频链接:https://www.bilibili.com/video/BV1Hz421b7ag/?
2024-09-18 10:45:18 425
原创 显示中文字体问题解决:ImportError: The _imagingft C module is not installed
字体文件:https://download.csdn.net/download/yangsn0719/89689325。然后在用下面这句代替原来的用cv2.putText写入文本的语句就可以啦。
2024-08-29 09:33:42 289
原创 如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG
【代码】如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG。
2024-08-26 10:13:13 695
原创 使用SAM分割一切模型对已有检测框的数据生成json分割标注-纯代码干货分享
【代码】借助sam分割模型对已经有标注框的数据生成json格式的多边形分割标注-纯代码干货分享。
2024-08-21 17:33:33 164 4
原创 借助Qwen-VL-Chat大模型生成xml标注-纯代码-干货分享
本工具参考:https://github.com/QwenLM/Qwen-VL/blob/master/TUTORIAL.md。本文默认使用以下代码前已准备好Qwen-VL的运行环境,且已下载了Qwen-VL-Chat模型文件。
2024-08-21 17:08:08 317
原创 一个人完成数据集收集和初步处理-纯代码实用干货
第三步:下载完成,重命名也完成之后,最好做一遍数据去重,不然重复图像很多的话,在后续标注的时候会产生更大的工作量。第一步:你想从下载一些图像,作为业务数据集的初始准备,使用如下代码(我推荐使用百度,重复数量更少)
2024-08-21 08:56:26 163 2
原创 python基础编程提升效率篇(一)——判断文件是否存在
经过测试发现,如果使用我习惯的判断方式,效率会比用os.path.exists(path) 正常判断文件是否存在慢好几倍不止。这里的主要原因是我习惯使用的方式,每次都要用os.listdir()读取一遍文件夹中的文件名列表,而且还要判断一个文件名是否在列表里,这耗费了大量时间。这也可能只是本人的代码习惯,不知道有没有人也会这样。唉,以后一定不能再这样用了,而且在以后写循环的时候,也要多注意一下类似的问题,吃一堑长一智。
2024-08-07 12:54:56 196
原创 yolov8如何设置显卡并批量推理_调用API推理示例
你可以在官网找到这样一个推理示例,但是这里没有设置显卡。这里提供一个用于可以设置显卡进行批量推理的示例。
2024-07-17 14:56:48 338
原创 yolov8训练数据警告检查
具体的源码出处以及警告原因可以在你自己的源码路径下./ultralytics/ultralytics/data/utils.py文件的verify_image、verify_image_label函数里查询。这里我把警告里出现两个冒号的都删了后面的一个,因为我根据冒号进行了分离字符串,我这里分类进行了保存,便于后面根据不同的警告原因进行不同检查和处理。首先,你需要将这些警告内容自行复制到一个新建的空白txt里,如下图。在yoloV8训练过程中,你应该也遇到过如图上的数据问题。后面自行检查这些数据即可。
2024-07-17 11:09:05 962
原创 pythons工具——裁剪labelme的json不规则多边形标签保存成矩形图像
使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。
2024-06-26 13:48:05 366
原创 python图像裁剪工具——根据labelme、lableimg标注文件裁剪目标图像
根据标注文件(格式支持json、xml)裁剪需要的目标类型图像, 用于进行分类训练。
2023-11-28 17:49:39 434 2
原创 pytorch模型的多batch推理
pytorch模型的多batch推理,这里用的是一个多标签分类模型,所以最后用的不是softmax而是sigmod。
2023-11-23 14:13:36 637
原创 YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件
【代码】YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件。
2023-04-06 13:51:29 555
原创 人脸识别insightFace-模型训练config.py文件注释详解
# !/usr/bin/python# -*- encoding: utf-8 -*-import numpy as npimport osfrom easydict import EasyDict as edict# config配置是最基本的配置,如果后面出现相同的,则被覆盖config = edict()config.bn_mom = 0.9 # 反向传播的momentumconfig.workspace = 256
2020-12-22 16:26:44 968 4
原创 insightFace跳坑实录(2020.11.18)
项目场景:insigthface这个项目真的有点费劲,研究了两三天,到处跳坑,总算是能够在公司设备上运行起来了,这里暂时先记录下自己这两天遇到的坑。先说下我这边的设备配置:显卡型号:GeForce RTX 2080 SUPER发行版本:CentOS Linux 7 (Core)最开始的CUDA版本:9.0(跳坑的一切罪恶之源)问题描述:在以上配置之下,当我按照官网源码步骤想测试一下的时候,我输入以下运行命令python recognition/ArcFace/verification.py
2020-11-18 14:06:08 184 1
原创 Pytorch_Retinaface源码测试记录(2020.11.06)
Pytorch_Retinaface在测试的时候遇到了点问题,浪费了半天时间在这个问题的解决上面,刚看到前辈的文章终于解决了。参考内容:1、 https://blog.csdn.net/qq_35975447/article/details/1094479292、官方说明:https://github.com/biubug6/Pytorch_Retinaface添加链接描述测试过程遇到的问题及其解决:首先把需要用到的数据集下载下来,环境安装我用的是现成的一个pytorch环境,这些都没啥问题,官方
2020-11-06 10:55:02 173 1
原创 人脸识别(Facenet)源码测试(20.11.4)
由于Facenet官方源码时间比较久了,python版本也还是3.5版本,完全按照Validate on LFW · davidsandberg/facenet Wiki的官方说明出现了一些版本上的问题,因此在这里做个记录。参考网址:1、 github源码网站Validate on LFW · davidsandberg/facenet Wiki2、 csdn博客:从facenet源码中测试人脸比较的准确率3、 博客园:facenet 进行人脸识别测试4、 问题处理(百度/必应等直接搜索)遇到的
2020-11-04 14:49:42 281
原创 行人重识别Deep person reid源码测试(Torchreid)(一)
行人重识别Deep person reid复现:最近有接触一个行人重识别相关的项目,网上没有找到很详细的教程复现,这里记录下自己根据官方说明文档的测试流程,也是对先人前辈的工作做了一个搬运,用来给自己做备忘录,也希望能够给他人有所参考。源码网址:https://github.com/KaiyangZhou/deep-person-reid论文网址:https://arxiv.org/abs/1910.10093训练好的模型:数据集下载:内容:系统环境:Linux“我试了在Windows下配
2020-10-28 13:46:33 7989 9
转载 NVIDIA-SMI系列命令总结
转载:https://blog.csdn.net/handsome_bear/article/details/809034771 NVIDIA-SMI介绍 nvidia-smi简称NVSMI,提供监控GPU使用情况和更改GPU状态的功能,是一个跨平台工具,它支持所有标准的NVIDIA驱动程序支持的Linux发行版以及从WindowsServer 2008 R2开始的64位的系统。该工具...
2019-04-05 11:21:34 1825
转载 GAN网络学习笔记
GAN网络学习笔记理解对抗网络,首先要了解生成模型和判别模型。生成模型与判别模型https://blog.csdn.net/zouxy09/article/details/8195017判别方法:由数据直接学习决策函数Y=f(X)或者条件概率分布P(Y|X)作为预测的模型,即判别模型。基本思想是有限样本条件下建立判别函数,不考虑样本的产生模型,直接研究预测模型。典型的判别模型包括k近邻,感...
2019-03-23 16:01:15 236
转载 Linux下conda的安装即使用(anaconda)
Linux下安装anacondaAnaconda2-5.2.0-Linux-x86_64.sh 603.4M 2018-05-30 13:04:33(python2)https://repo.continuum.io/archive/index.htmlAnaconda3-5.2.0-Linux-x86_64.sh 621.6 MiB 2018-05-3102:38(python3)...
2019-03-23 16:00:39 3288
原创 图像修复文章汇总
图像修复技术总结**加粗样式**图像修复技术的研究是计算机视觉以及计算机图形学的一个具有重大意义的研究课题。对于带有损失区域的图像,由于我们并不知道原本图像的具体形式,我们只能类似于“凭空捏造”一些像素去填补这种缺失。正因如此,图像修复实际是根据人类自己的视觉规则对图像进行分析,然后去修补。简言之,...
2019-01-25 11:59:02 7112
Transformer课程笔记
2024-09-19
图像异常检测算法调研-20230607
2024-06-12
人脸识别之insightface使用自己的数据集制作训练文件以及详细说明
2020-12-22
人脸识别之insightface使用自己的数据集制作训练文件以及详细说明
2020-12-22
20.09.01brhy面试题目.pdf
2020-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人