- 博客(7)
- 收藏
- 关注
原创 Transformer 网络架构理解与分析
Transformer网络架构解析摘要 Transformer是一种基于注意力机制的神经网络架构,彻底改变了序列建模方式。核心创新在于: 用全局注意力机制取代RNN的逐步传递,使每个token能直接获取全句信息 采用多头注意力机制,从多个角度捕获不同语义关系 引入位置编码解决序列顺序问题 通过Encoder-Decoder结构实现高效并行计算 相比RNN/LSTM,Transformer更适合处理长距离依赖,训练效率更高。其模块化设计包含自注意力、前馈网络和残差连接等组件,为大规模预训练模型奠定了基础。该架
2026-04-17 13:50:21
329
原创 全网最全MapTR详解!!!
MapTR: 基于Transformer的结构化高精地图在线构建方法 本文提出MapTR,将在线矢量化高精地图构建任务重新建模为结构化集合预测问题。通过三个关键创新:(1) 排列等价建模消除点序列顺序歧义;(2) 层次化查询嵌入显式编码实例和点结构;(3) 分层二分匹配实现稳定训练。实验表明,MapTR在nuScenes数据集上仅使用相机输入即达到50.3 mAP,推理速度达11.2 FPS,优于现有方法。该方法首次实现了实时、稳定的端到端矢量地图构建,为自动驾驶感知系统提供了高效解决方案。
2026-04-13 17:50:03
558
原创 VMA 亮点与网络结构分析 附对比MapTR!!
本文提出VMA系统,一种面向大规模自动驾驶场景的高精地图自动标注解决方案。系统采用分而治之策略,包含数据重建、场景切分、局部预测和全局合并的全流程。核心模块MapTR-based Unit Annotator网络直接输出结构化矢量地图,通过DETR-like解码器实现实例级预测,并采用迭代坐标细化机制提升几何精度。系统整合了自动标注与人机闭环,实现了从原始数据到高质量矢量地图的端到端生产。相比单点模型,VMA更强调工业化pipeline设计,为大规模高精地图生产提供了实用化方案。
2026-04-13 15:09:15
387
原创 YOLOv8 vs YOLO11对比 全网最详细!!!
YOLOv8 架构特点: YOLO11 架构改进:│ ├── C2f (固定3×3卷积) → │ ├── C3k2 (可配置卷积核,多尺度感受野)│ └── 无注意力机制 → │ └── C2PSA (空间注意力模块)│ ││ │└── 基本一致 └── 基本一致用传话游戏现象类比网络中发生的事梯度消失每个人只记住上一句的80%,传到第10个人时只剩 0.8¹⁰ ≈10%每层梯度 < 1,连乘后趋近于0,前面的层几乎学不到东西梯度爆炸。
2026-04-10 11:09:29
724
原创 YoloV11训练自标注数据集和推理应用
本文介绍了YoloV11的源码下载、数据集准备、环境配置、训练和推理的完整流程。首先,源码可从GitHub官网下载。数据集准备包括使用Labelimg进行数据标注,并通过Python代码将数据集划分为训练集和验证集。接着,创建训练配置文件(如pills.yaml),并配置环境依赖(requirements.txt)。最后,进行模型训练和推理。整个过程涵盖了从数据标注到模型部署的关键步骤,适用于Yolo系列模型的开发与应用。
2025-05-13 14:58:15
2438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅