自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

m0_65517363的博客

原创 Transformer 网络架构理解与分析

Transformer网络架构解析摘要 Transformer是一种基于注意力机制的神经网络架构，彻底改变了序列建模方式。核心创新在于：用全局注意力机制取代RNN的逐步传递，使每个token能直接获取全句信息采用多头注意力机制，从多个角度捕获不同语义关系引入位置编码解决序列顺序问题通过Encoder-Decoder结构实现高效并行计算相比RNN/LSTM，Transformer更适合处理长距离依赖，训练效率更高。其模块化设计包含自注意力、前馈网络和残差连接等组件，为大规模预训练模型奠定了基础。该架

2026-04-17 13:50:21 329

原创全网最全MapTR详解！！！

MapTR: 基于Transformer的结构化高精地图在线构建方法本文提出MapTR，将在线矢量化高精地图构建任务重新建模为结构化集合预测问题。通过三个关键创新：(1) 排列等价建模消除点序列顺序歧义；(2) 层次化查询嵌入显式编码实例和点结构；(3) 分层二分匹配实现稳定训练。实验表明，MapTR在nuScenes数据集上仅使用相机输入即达到50.3 mAP，推理速度达11.2 FPS，优于现有方法。该方法首次实现了实时、稳定的端到端矢量地图构建，为自动驾驶感知系统提供了高效解决方案。

2026-04-13 17:50:03 558

原创 VMA 亮点与网络结构分析附对比MapTR！！

本文提出VMA系统，一种面向大规模自动驾驶场景的高精地图自动标注解决方案。系统采用分而治之策略，包含数据重建、场景切分、局部预测和全局合并的全流程。核心模块MapTR-based Unit Annotator网络直接输出结构化矢量地图，通过DETR-like解码器实现实例级预测，并采用迭代坐标细化机制提升几何精度。系统整合了自动标注与人机闭环，实现了从原始数据到高质量矢量地图的端到端生产。相比单点模型，VMA更强调工业化pipeline设计，为大规模高精地图生产提供了实用化方案。

2026-04-13 15:09:15 387

原创 YOLOv8 vs YOLO11对比全网最详细！！！

YOLOv8 架构特点: YOLO11 架构改进:│ ├── C2f (固定3×3卷积) → │ ├── C3k2 (可配置卷积核，多尺度感受野)│ └── 无注意力机制 → │ └── C2PSA (空间注意力模块)│ ││ │└── 基本一致 └── 基本一致用传话游戏现象类比网络中发生的事梯度消失每个人只记住上一句的80%，传到第10个人时只剩 0.8¹⁰ ≈10%每层梯度 < 1，连乘后趋近于0，前面的层几乎学不到东西梯度爆炸。

2026-04-10 11:09:29 724

原创 C# 图片格式的转换(Hobject、Mat)

【代码】C# 图片格式的转换(Hobject、Mat)

2025-05-22 11:12:41 390

原创 Git：如何将clone下来的项目上传到自己的仓库

【代码】Git：如何将clone下来的项目上传到自己的仓库。

2025-05-14 11:07:33 429

原创 YoloV11训练自标注数据集和推理应用

本文介绍了YoloV11的源码下载、数据集准备、环境配置、训练和推理的完整流程。首先，源码可从GitHub官网下载。数据集准备包括使用Labelimg进行数据标注，并通过Python代码将数据集划分为训练集和验证集。接着，创建训练配置文件（如pills.yaml），并配置环境依赖（requirements.txt）。最后，进行模型训练和推理。整个过程涵盖了从数据标注到模型部署的关键步骤，适用于Yolo系列模型的开发与应用。

2025-05-13 14:58:15 2438

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除