kyrie变相不减速
码龄5年
关注
提问 私信
  • 博客:48,833
    48,833
    总访问量
  • 8
    原创
  • 1,209,395
    排名
  • 7
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2019-11-04
博客简介:

qq_45836365的博客

查看详细资料
个人成就
  • 获得31次点赞
  • 内容获得31次评论
  • 获得293次收藏
  • 代码片获得1,321次分享
创作历程
  • 5篇
    2022年
  • 3篇
    2021年
成就勋章
兴趣领域 设置
  • 人工智能
    opencv计算机视觉机器学习深度学习图像处理
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

DETR训练自己的数据集

本文记录利用官方提供的代码来训练验证自己的数据集的过程以及一些注意事项。该数据集原始的标签保存格式为yolo类型的txt文件,下面提供的代码能够实现数据集标签从txt文件到coco json格式的转化.该部分为利用训练得到的模型权重进行检测验证。在detr工程文件下的images文件夹存放所有待验证的图片,infer_results存放所有的验证结果。DETR需要的数据集格式为coco格式,其原始图片与标签分为训练集和验证集,其保存目录为。output_dir为保存训练得到的模型权重的地址。
原创
发布博客 2022.12.09 ·
8540 阅读 ·
18 点赞 ·
17 评论 ·
114 收藏

VPGNet数据集解析且将分割标签转化为目标检测标签

VPGNet是一个包含了四个场景(晴天,夜间,阴雨等)下的交通路况数据集,其主要是针对地面标志(箭头线,人行道)的任务,该数据集一共包括以下17类地面标注该数据集下载地址为:VPGNet数据集下载下载解压得到的数据集文件格式为Scene_x—%datetime_aaa_xxx-----id.mat该数据集的所有有用信息均保存在一个(6404805)的mat文件中。数据集的关键信息均保存在(6404805)的数组中,前三个通道为图片的rgb三通道信息,第四维通道为图像的17类二值分割图像(像素值为
原创
发布博客 2022.12.06 ·
2026 阅读 ·
0 点赞 ·
9 评论 ·
19 收藏

DETR、conditional DETR、Deformable DETR

DETR是将transformer机制应用到目标检测领域的算法模型。其主要思想是利用transformer的encoder-decoder架构,利用注意力机制来实现端到端获得目标检测的结果。如图所示为DETR模型的结构,其主要由backbone,transformer block,prediction heads三部分组成。backbone作为输入图像的初步特征提取,主要由卷积神经网络如(resnet50)完成,对于输入图像(B×3×H×W),其中B为batch_size,H,W为图像的宽高。
原创
发布博客 2022.11.22 ·
2288 阅读 ·
1 点赞 ·
0 评论 ·
15 收藏

VIT模型个人笔记

前言VIT模型即vision transformer,其想法是将在NLP领域的基于自注意力机制transformer模型用于图像任务中,相比于图像任务中的传统的基于卷积神经网络模型,VIT模型在大数据集上有着比卷积网络更强的效果和更节约的成本。transformertransformer模型...
原创
发布博客 2022.03.01 ·
12326 阅读 ·
5 点赞 ·
1 评论 ·
55 收藏

图注意力网络(GAT)

一、图数据结构知识图是指一系列相互连接的节点,且每个节点自己也具有一定的特征。如下图所示即一个典型的图结构。 该图一共有五个结点,每个结点有自己的特征Fi.另一方面,为了描述图的结构特点,常用邻接矩阵A和度矩阵D.其中,对于一个N个结点的图来说,邻接矩阵A为一个大小为N*N的对称矩阵,若两个结点i,j直接有连接,则Aij=Aji=1,否则为0.度矩阵D大小同样,除对角线上,其余位置的值均为0,Dii的值为与结点i直接连接的结点的数目。实际处理中还存在一种常见的矩阵拉普拉斯矩阵L,L=D-A。二、图注
原创
发布博客 2022.02.02 ·
21984 阅读 ·
7 点赞 ·
4 评论 ·
91 收藏

YOLO V3个人笔记

Yolo v3算法的理解YOLO V3算法在基于V1 V2的算法基础上,做了以下几个方面的改进来增加算法的性能多尺度下的Anchor box YOLO v3算法分别在三个不同的尺度下各得到9个anchor box,与YOLO V2产生anchor box 的方法一样,我们同样采用在三个不同尺度下使用k-means算法,一共得到9个anchor box。 通过这样的方法得到更多大小的anchor box,有利于对于小目标的目标检测特征提取 与YOLO v2采用Darklet-19
原创
发布博客 2021.10.25 ·
192 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

YOLO v2算法改进理解(自己的笔记理解)

YOLO V2算法原理理解在YOLO V1算法中存在两个明显的缺点,一是由于每个bounding box的产生在一开始是无规律的,因此该算法在定位误差上并不理想,其次,由于YOLO v1每张图片只产生772个预测框,因此对于密度大的小物体目标的检测的效果也不理想。为此,YOLO v2算法提出了一系列想法来改进这些问题,提高目标检测的recall(即检测出所有目标的能力)和定位能力。批归一化操作 批归一化操作,即对每个神元得到的输入数据xi,我们通过求其均值和方差,将其归一化到满足(0,1)分
原创
发布博客 2021.10.10 ·
424 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

2021-10-04

python利用 mediapipe库做人体关健点检测 mediapipe库是对人体33个关键点做检测并标记的一个功能库,其33个人体关键点如下图所示该库的具体用法如下1.对静态图像标记import mediapipe as mp #引入库mp_pose = mp.solutions.pose # 导入绘制函数 mp_drawing = mp.solutions.drawing_utils self.cv_show("s",img) pose = mp_
原创
发布博客 2021.10.04 ·
443 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏