自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【ros1-neotic rosbag play播放后马上退出的解决办法】

rosbag play后闪退问题的解决办法。

2025-10-24 14:30:46 225

原创 百度的HGNetV2详解

最近在读目标检测论文D-FINE时,发现其骨干网络是百度的HGNetV2,而且最近很多其他目标检测网络也都将骨干网络替换成了HGNetV2,其综合性能和目前主要的图像分类网络对比如下。综合计算量和精度,HGNetV2是目前很实用的一种网络架构,但是百度并未发表它相关的论文,网上也没有很详细的讲解,因此就扒了一下D-FINE中HGNetV2部分的源码,将其整个网络架构记录下来分享一下。模型名称Top-1精度参数量(M)计算量(GFLOPs)架构创新点适用场景80.3%5.80.9。

2025-08-20 14:34:40 1645

原创 一文掌握Transformer所有细节

Transformer结构的编码部分,是对每一个输入词向量进行信息的混合,注意力机制就体现在对不同信息混合的比例上,编码后词向量的数量和每个词向量的维度都没有改变。解码部分训练阶段和测试阶段是有区别的,训练阶段将gt进行右移后输入到解码网络中,每个词向量先跟输入部分自己能看到的(左侧的)信息进行混合,混合生成的词向量再和编码的最终结果进行信息混合,经过混合和变换后生成最终输出结果;

2025-08-06 18:43:19 905

原创 【CSDN文章快速转知乎格式】

CSDN文档转知乎

2025-07-21 12:42:27 194

原创 【从本质上理解什么是信息熵,交叉熵和KL散度】

快速了解信息熵,交叉熵的真实含义

2025-07-20 14:33:16 769

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除