- 博客(42)
- 收藏
- 关注
原创 Self-attention自注意力机制
可变形交叉注意力模块(Deformable Cross Attention Module)是一种神经网络结构,通常用于处理具有空间结构的数据,如图像或视频数据。这种模块结合了注意力机制和可变形卷积(deformable convolution)的思想,以更好地捕捉输入数据中的空间关系和特征。
2024-05-14 18:17:04
619
2
原创 【以规划为导向的自动驾驶】Planning-oriented Autonomous Driving
现代自动驾驶系统的特点是按顺序进行模块化任务,即感知、预测和规划。为了执行各种任务并实现高级智能,当代方法要么为单个任务部署独立模型,要么设计具有独立头部的多任务范式。但是,他们可能会遭受累积错误或任务协调不足的困扰。相反,我们认为应该设计和优化一个有利的框架,以追求最终目标,即自动驾驶汽车的规划。以此为导向,我们重新审视感知和预测中的关键组成部分,并确定任务的优先级,以便所有这些任务都有助于规划。我们推出了统一自动驾驶(UniAD),这是一个最新的综合框架,将全栈驾驶任务整合到一个网络中。
2024-05-14 18:12:52
982
1
原创 Stacked Hourglass Networks for Human Pose Estimation 用于人体姿态估计的堆叠沙漏网络
本文主要是介绍了一个在当时是新的姿态估计的网络结构。由于本人在研究自动驾驶领域中车道线识别时使用到此网络结构,故这里主要是对整个网络的结构和思想进行一个梳理,可以进一步明白后序一些基于此网络结构的工作,不涉及到 姿态估计领域 的一些见解和讨论,所以本文主要引出和介绍 hourglass 网络。
2024-04-13 15:42:00
1307
原创 YOLOv8:Roboflow公开数据集训练模型
Roboflow是一个提供计算机视觉数据集管理和处理工具的平台。虽然Roboflow本身并不创建或策划公开数据集,但它提供了一系列功能,帮助用户组织、预处理、增强和导出计算机视觉数据集。
2024-03-24 22:03:41
2610
1
原创 车道线检测论文:《Ultra Fast Structure-aware Deep Lane Detection》
该论文标题为《Ultra Fast Structure-aware Deep Lane Detection》,作者是浙江大学计算机科学与技术学院的Zequn Qin、Huanyu Wang和Xi Li。论文提出了一种新颖的、简单而有效的车道检测方法,旨在解决具有挑战性场景下的车道检测问题,并实现极快的检测速度。
2024-03-23 23:30:07
872
原创 Ultralytics(YOLOv8)的环境部署与安装
YOLOv8 是 ultralytics 公司在 2023 年 1月 10 号开源的 YOLOv5 的下一个重大更新版本,目前支持图像分类、物体检测和实例分割任务。
2024-03-23 21:52:03
9074
8
原创 【PINet车道线检测】代码复现过程
这是篇关于自动驾驶中车道检测技术的研究论文,标题为“Key Points Estimation and Point Instance Segmentation Approach for Lane Detection”,作者包括Yeongmin Ko、Younkwan Lee、Shoaib Azam、Farzeen Munir、Moongu Jeon和Witold Pedrycz。论文提出了一种名为Point Instance Network (PINet)的车道检测方法,该方法基于关键点估计和实例分割方法。
2024-03-19 22:28:20
1231
13
原创 PINet车道线检测论文:key points estimation and point instance segmentation approach for lane detection.
是篇关于自动驾驶中车道检测技术的研究论文,标题为“Key Points Estimation and Point Instance Segmentation Approach for Lane Detection”,作者包括Yeongmin Ko、Younkwan Lee、Shoaib Azam、Farzeen Munir、Moongu Jeon和Witold Pedrycz。论文提出了一种名为Point Instance Network (PINet)的车道检测方法,该方法基于关键点估计和实例分割方法。
2024-03-17 16:22:41
1192
2
原创 PyTorch完整的神经网络模型训练(使用GPU训练)
使用GPU进行神经网络模型训练可以加速训练速度、处理大规模数据和模型、提供更好的模型性能,并且与PyTorch等深度学习框架良好地集成。这些优点使得GPU成为加速神经网络训练的重要工具,为研究人员和从业者提供了更高效的深度学习开发环境。
2024-03-10 20:16:25
4977
1
原创 Pytorch之神经网络最大池化层
池化层(Pooling layer)是深度学习神经网络中常用的一种层类型,它的作用是对输入数据进行降采样(downsampling)操作。
2024-03-07 20:34:46
743
原创 数据结构中红黑树的概念以及代码
红黑树(Red-Black Tree)是一种自平衡的二叉搜索树,它在插入和删除节点时通过一系列的旋转和重新着色操作来保持平衡。
2024-03-05 21:24:09
367
原创 Pytorch之卷积操作
卷积是一种基本的数学操作,常用于信号处理和图像处理领域。在计算机视觉中,卷积操作是一种重要的技术,用于提取图像的特征并进行图像处理。
2024-03-05 20:14:52
957
原创 Torchvision中的数据集的下载和使用
Torchvision是PyTorch的一个库,用于计算机视觉任务。它提供了许多常用的数据集,可以用于训练和测试计算机视觉模型。
2024-03-03 14:46:55
883
python知识点总结
2024-03-04
Hadoop知识点梳理
2024-03-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人