自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 资源 (4)
  • 收藏
  • 关注

原创 如何用mmclassification训练多标签多分类数据

我这里只是增加了一些度量函数,方便可视化多标签的指标情况,并没有更新其他地方,训练时还是会验证原来的指标,里面调用的Metric类可以参考这篇文章:https://blog.csdn.net/u013250861/article/details/122727704。训练数据标签文件格式如下,每行的空格前面是路径(图像文件所在的绝对路径),后面是标签名,因为特殊要求这里我的每张图像都记录了三个标签每个标签用“,”分开(具体看自己的需求),我的训练标签数量是17个。

2024-10-23 18:03:13 625

原创 yolov8图像分类推理程序的预处理步骤抽取出来-纯代码-干货分享

•将图像从 (H, W, C) 转换为 (C, H, W) 格式。官网文档:https://docs.ultralytics.com/zh/models/yolov8/•new_shape 是目标尺寸,color 是填充颜色,默认为灰色 (114, 114, 114)。•将图像从 BGR 转换为 RGB 格式。•将像素值归一化到 [0, 1] 范围。•读取图像并调用 letterbox_image 函数进行调整大小和填充。•该函数用于调整图像大小并保持宽高比,同时在图像周围添加黑色填充。

2024-10-15 15:59:06 184

原创 使用from torchinfo import summary 查看网络结构

分享一个好用的查看网络结构的工具,从ghostnet的源码中看见的,其他的网络结构换个函数就行。用到你的程序里面试试吧!

2024-10-14 15:28:53 151

原创 【YOLOv8改进】 YOLOv8 更换骨干网络之GhostNetV3步骤详解

这里yolov8源码版本是 ultralytics-8.2.54GhostNetV3 源码下载 https://codeload.github.com/huawei-noah/Efficient-AI-Backbones将ghostnetv3.py文件复制一份到源码./ultralytics-8.2.54/ultralytics/nn/modules路径下我根据mobilenetv4的教程,修改了ghostnetv3.py文件的以下部分:class GhostNet(nn.Module):

2024-10-12 15:36:10 398 2

原创 Agent:原理与快速构建 | 人工智能 | Langchain | Python ——学习笔记

视频链接:https://www.bilibili.com/video/BV1Hz421b7ag/?

2024-09-18 10:45:18 425

原创 显示中文字体问题解决:ImportError: The _imagingft C module is not installed

字体文件:https://download.csdn.net/download/yangsn0719/89689325。然后在用下面这句代替原来的用cv2.putText写入文本的语句就可以啦。

2024-08-29 09:33:42 289

原创 如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG

【代码】如何解决libpng warning: iCCP: known incorrect sRGB profile、OSError: cannot write mode RGBA as JPEG。

2024-08-26 10:13:13 695

原创 使用SAM分割一切模型对已有检测框的数据生成json分割标注-纯代码干货分享

【代码】借助sam分割模型对已经有标注框的数据生成json格式的多边形分割标注-纯代码干货分享。

2024-08-21 17:33:33 164 4

原创 借助Qwen-VL-Chat大模型生成xml标注-纯代码-干货分享

本工具参考:https://github.com/QwenLM/Qwen-VL/blob/master/TUTORIAL.md。本文默认使用以下代码前已准备好Qwen-VL的运行环境,且已下载了Qwen-VL-Chat模型文件。

2024-08-21 17:08:08 317

原创 一个人完成数据集收集和初步处理-纯代码实用干货

第三步:下载完成,重命名也完成之后,最好做一遍数据去重,不然重复图像很多的话,在后续标注的时候会产生更大的工作量。第一步:你想从下载一些图像,作为业务数据集的初始准备,使用如下代码(我推荐使用百度,重复数量更少)

2024-08-21 08:56:26 163 2

原创 python基础编程提升效率篇(一)——判断文件是否存在

经过测试发现,如果使用我习惯的判断方式,效率会比用os.path.exists(path) 正常判断文件是否存在慢好几倍不止。这里的主要原因是我习惯使用的方式,每次都要用os.listdir()读取一遍文件夹中的文件名列表,而且还要判断一个文件名是否在列表里,这耗费了大量时间。这也可能只是本人的代码习惯,不知道有没有人也会这样。唉,以后一定不能再这样用了,而且在以后写循环的时候,也要多注意一下类似的问题,吃一堑长一智。

2024-08-07 12:54:56 196

原创 yolov8如何设置显卡并批量推理_调用API推理示例

你可以在官网找到这样一个推理示例,但是这里没有设置显卡。这里提供一个用于可以设置显卡进行批量推理的示例。

2024-07-17 14:56:48 338

原创 yolov8训练数据警告检查

具体的源码出处以及警告原因可以在你自己的源码路径下./ultralytics/ultralytics/data/utils.py文件的verify_image、verify_image_label函数里查询。这里我把警告里出现两个冒号的都删了后面的一个,因为我根据冒号进行了分离字符串,我这里分类进行了保存,便于后面根据不同的警告原因进行不同检查和处理。首先,你需要将这些警告内容自行复制到一个新建的空白txt里,如下图。在yoloV8训练过程中,你应该也遇到过如图上的数据问题。后面自行检查这些数据即可。

2024-07-17 11:09:05 962

原创 python-将yolo格式的标签转换成xml格式标签

【代码】python-将yolo格式的标签转换成xml格式标签。

2024-07-02 16:56:21 158

原创 pythons工具——裁剪labelme的json不规则多边形标签保存成矩形图像

使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。使用以下程序,裁剪labelme的json不规则多边形标签保存成矩形图像。

2024-06-26 13:48:05 366

原创 python视频抽帧工具

【代码】python视频抽帧工具。

2024-06-21 18:12:11 202

原创 python文件重命名

【代码】python文件重命名。

2024-02-18 14:07:35 343

原创 transform数据处理样例

测试时发现自己训练时,图像读取出现颜色通道未转换,这里记录一下,transform数据处理的示例。

2023-11-29 10:54:03 103

原创 python图像裁剪工具——根据labelme、lableimg标注文件裁剪目标图像

根据标注文件(格式支持json、xml)裁剪需要的目标类型图像, 用于进行分类训练。

2023-11-28 17:49:39 434 2

原创 pytorch数据处理样例

【代码】pytorch数据处理样例。

2023-11-28 17:43:26 104

原创 pytorch多标签分类模型的单张图像推理

【代码】pytorch多标签分类模型的单张图像推理。

2023-11-23 14:17:46 228

原创 pytorch模型的多batch推理

pytorch模型的多batch推理,这里用的是一个多标签分类模型,所以最后用的不是softmax而是sigmod。

2023-11-23 14:13:36 637

原创 YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件

【代码】YOLOv5 小目标检测数据预处理——批量数据裁剪并切分json标注文件。

2023-04-06 13:51:29 555

原创 人脸识别insightFace-模型训练config.py文件注释详解

# !/usr/bin/python# -*- encoding: utf-8 -*-import numpy as npimport osfrom easydict import EasyDict as edict# config配置是最基本的配置,如果后面出现相同的,则被覆盖config = edict()config.bn_mom = 0.9 # 反向传播的momentumconfig.workspace = 256

2020-12-22 16:26:44 968 4

原创 insightFace跳坑实录(2020.11.18)

项目场景:insigthface这个项目真的有点费劲,研究了两三天,到处跳坑,总算是能够在公司设备上运行起来了,这里暂时先记录下自己这两天遇到的坑。先说下我这边的设备配置:显卡型号:GeForce RTX 2080 SUPER发行版本:CentOS Linux 7 (Core)最开始的CUDA版本:9.0(跳坑的一切罪恶之源)问题描述:在以上配置之下,当我按照官网源码步骤想测试一下的时候,我输入以下运行命令python recognition/ArcFace/verification.py

2020-11-18 14:06:08 184 1

原创 Pytorch_Retinaface源码测试记录(2020.11.06)

Pytorch_Retinaface在测试的时候遇到了点问题,浪费了半天时间在这个问题的解决上面,刚看到前辈的文章终于解决了。参考内容:1、 https://blog.csdn.net/qq_35975447/article/details/1094479292、官方说明:https://github.com/biubug6/Pytorch_Retinaface添加链接描述测试过程遇到的问题及其解决:首先把需要用到的数据集下载下来,环境安装我用的是现成的一个pytorch环境,这些都没啥问题,官方

2020-11-06 10:55:02 173 1

原创 人脸识别(Facenet)源码测试(20.11.4)

由于Facenet官方源码时间比较久了,python版本也还是3.5版本,完全按照Validate on LFW · davidsandberg/facenet Wiki的官方说明出现了一些版本上的问题,因此在这里做个记录。参考网址:1、 github源码网站Validate on LFW · davidsandberg/facenet Wiki2、 csdn博客:从facenet源码中测试人脸比较的准确率3、 博客园:facenet 进行人脸识别测试4、 问题处理(百度/必应等直接搜索)遇到的

2020-11-04 14:49:42 281

原创 行人重识别Deep person reid源码测试(Torchreid)(一)

行人重识别Deep person reid复现:最近有接触一个行人重识别相关的项目,网上没有找到很详细的教程复现,这里记录下自己根据官方说明文档的测试流程,也是对先人前辈的工作做了一个搬运,用来给自己做备忘录,也希望能够给他人有所参考。源码网址:https://github.com/KaiyangZhou/deep-person-reid论文网址:https://arxiv.org/abs/1910.10093训练好的模型:数据集下载:内容:系统环境:Linux“我试了在Windows下配

2020-10-28 13:46:33 7989 9

转载 NVIDIA-SMI系列命令总结

转载:https://blog.csdn.net/handsome_bear/article/details/809034771 NVIDIA-SMI介绍 nvidia-smi简称NVSMI,提供监控GPU使用情况和更改GPU状态的功能,是一个跨平台工具,它支持所有标准的NVIDIA驱动程序支持的Linux发行版以及从WindowsServer 2008 R2开始的64位的系统。该工具...

2019-04-05 11:21:34 1825

转载 GAN网络学习笔记

GAN网络学习笔记理解对抗网络,首先要了解生成模型和判别模型。生成模型与判别模型https://blog.csdn.net/zouxy09/article/details/8195017判别方法:由数据直接学习决策函数Y=f(X)或者条件概率分布P(Y|X)作为预测的模型,即判别模型。基本思想是有限样本条件下建立判别函数,不考虑样本的产生模型,直接研究预测模型。典型的判别模型包括k近邻,感...

2019-03-23 16:01:15 236

转载 Linux下conda的安装即使用(anaconda)

Linux下安装anacondaAnaconda2-5.2.0-Linux-x86_64.sh 603.4M 2018-05-30 13:04:33(python2)https://repo.continuum.io/archive/index.htmlAnaconda3-5.2.0-Linux-x86_64.sh 621.6 MiB 2018-05-3102:38(python3)...

2019-03-23 16:00:39 3288

原创 图像修复文章汇总

图像修复技术总结**加粗样式**图像修复技术的研究是计算机视觉以及计算机图形学的一个具有重大意义的研究课题。对于带有损失区域的图像,由于我们并不知道原本图像的具体形式,我们只能类似于“凭空捏造”一些像素去填补这种缺失。正因如此,图像修复实际是根据人类自己的视觉规则对图像进行分析,然后去修补。简言之,...

2019-01-25 11:59:02 7112

Transformer课程笔记

Transformer公开课(1)注意力机制.ipynb Transformer公开课(2)Transformer架构的PyTorch实现.ipynb Transformer公开课(3)Huggingface应用与预训练模型调用.ipynb Transformer公开课(4)Decoder-Only架构与文字生成案例数据处理.ipynb

2024-09-19

显示中文字体问题解决:ImportError: The -imagingft C module is not installed

中文字体文件

2024-08-29

利用Sam分割一切打标签

使用sam分割模型对已经有xml标注的数据进行打标,生成json格式的多边形分割的标注文件

2024-07-18

yolov5数码管标注数据

单字符标注,可直接用于训练

2024-07-12

网思算法工程师面试问题-20240530.docx

网思算法工程师面试问题——20240530.docx

2024-06-20

图像异常检测算法调研-20230607

异常检测是一种用于识别不符合预期行为的异常模式(称为异常值)的技术。通常,这被视为一个无监督学习问题(也可是半监督或弱监督学习),其中异常样本是先验未知的,并且假设大部分训练数据集由“正常”数据组成。 早期的异常检测算法大多应用于数据挖掘领域(将异常样本分为三个类别:点异常、上下文异常、集群异常)。而近年来随着计算机视觉和深度学习等相关技术的发展, 许多相关工作将异常检测引入到图像处理领域来解决样本匮乏情况下的目标检测问题。 异常检测专栏(一)异常检测概述:https://zhuanlan.zhihu.com/p/628390229

2024-06-12

docker、docker-compose离线安装包

可一键离线安装docker、docker-compose

2024-01-06

ubuntu18.04 G++ GCC MAKE一键安装 全为dep包直接安装即可

ubuntu18.04 G++ GCC MAKE一键安装 全为dep包直接安装即可

2024-01-06

YOLOV8语义分割预训练模型

YOLOV8语义分割预训练模型

2023-07-05

YOLOV8关键点预训练模型

YOLOV8关键点预训练模型

2023-07-05

YOLOV8分类预训练模型

YOLOV8分类预训练模型

2023-07-05

YOLOV8检测预训练模型

YOLOV8检测预训练模型

2023-07-05

Yolo系列网络结构图visio文件

Yolo系列网络结构图visio文件

2023-04-12

关键点检测任务:labelme标注文件转换成coco格式

参考已有资源修改,避免了标注时点位顺序与所指定的顺序不一致的问题

2023-03-21

ONNX模型相关学习笔记

ONNX模型相关学习笔记

2022-08-24

人脸识别之insightface使用自己的数据集制作训练文件以及详细说明

# 3、制作验证集.bin文件 python recognition/tools/generate_image_valid.py #需要预先制作一个人物名单对应表,比如存放于valid.txt文件中 python recognition/tools/make_bin_tool/lfw2pack.py

2020-12-22

人脸识别之insightface使用自己的数据集制作训练文件以及详细说明

# 数据处理: 1、使用facenet中的文件或insight项目中的align_dataset_mtcnn.py将原始人脸数据先检测并处理成112x112大小, 2、制作训练集.rec文件 # python insightface/recognition/tools/im2rec.py --list --recursive /准备存放.lst的路径/准备存放.lst文件的名称(NBA) /图像文件夹路径/ #生成.lst # python im2rec2.py /刚刚生成的.lst文件路径/.lst的文件名 /图像文件夹路径/ ##生成.rec

2020-12-22

br测试工程师笔试题.pdf

beijing博$睿*hong远,招聘测试开发工程师,面向20届毕业生 笔试题目,不难,涉及内容较广泛,算是给大家一个参考

2020-09-04

20.09.01brhy面试题目.pdf

面试了北京的一些软件公司,负责人问了很多较基础的一些题目,但涉及面较广,唉,算是给大家一个参考吧,这个岗位面向20应届生,有需要的可找我推荐链接

2020-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除