深度学习
文章平均质量分 87
泽渊20
这个作者很懒,什么都没留下…
展开
-
扩散模型初探之DDPM
深度生成模型已经打开了另一个人类创造力的深奥领域。通过捕捉和概括数据中的模式,我们进入了全方位人工智能创造力(AIGC)的时代。值得注意的是,扩散模型作为最重要的生成模型之一,将人类构思转化为可在多个领域实现的具体实例,包括图像、文本、语音、生物学和医疗保健等。如何让机器拥有类似人类的想象力?深度生成模型,包括变分自动编码器(VAE)、能量基模型(EBM)、生成对抗网络(GAN)、归一化流(NF) 和扩散模型,展示了在生成逼真样本方面的显著潜力。扩散模型代表了这一领域的先进水平。这些模型有效地克服了诸如VA原创 2024-01-09 14:04:32 · 1090 阅读 · 0 评论 -
对比学习(一):CV领域对比学习的兴起
论文Dimensionality Reduction by Learning an Invariant Mapping是由LeCun团队做的比较早的关于对比学习的工作。在这篇论文中,作者研究了一种降维方法,学习不变映射(DrLIM),用于学习一个全局一致的非线性函数,该函数将数据均匀映射到输出流形上。学习仅依赖于邻域关系,不需要输入空间中的任何距离度量。现有降维方法一般有两个缺点,其一是不会产生一个从输入到流形的函数或映射,这个函数或映射可以应用于与训练点的关系未知的新点原创 2023-11-13 17:52:38 · 198 阅读 · 0 评论 -
MMdetection3d学习(二)
在轻松掌握 MMDetection 整体构建流程(一)文中,重点分析了 MMDetection 框架中 Model 整体构建流程,但仅对 Model 算法组件方面进行深入分析,并未涉及整个框架训练和测试流程。本文核心内容是按照抽象到具体方式,从多个层次进行训练和测试流程深入解析,从最抽象层讲起,到最后核心代码实现,希望帮助大家更容易理解 MMDetection 开源框架整体构建细节。原创 2023-08-07 11:10:58 · 442 阅读 · 0 评论 -
UFLD & UFLDv2论文学习
为了解决上述问题,作者提出将车道检测制定为基于全局图像特征的基于行选择方法。换句话说就是使用全局特征在每个预定义行上选择正确的车道位置。在公式中,车道表示为预定义行的一系列水平位置,即行锚点。为了表示位置,第一步是网格化。在每个行锚点上,位置被划分为许多单元格。这样,通道检测可以描述为在预定义的行锚点上选择某些单元格,如图3(a)所示。设最大车道数为C,行锚点数为h,网格单元数为w。设X为全局图像特征。原创 2023-08-07 10:54:44 · 880 阅读 · 0 评论 -
conda常用命令和Linux下安装conda
期间有ENTER的地方可以直接回车,遇到MORE信息,可以摁Q键跳过,遇到需要输入yes|no的地方输入yes即可。即可直接从清华镜像网站上下载anaconda安装包, 视情况选择自己的版本,我选择的是2021.11版本。usrname对应账户名,这里需要根据自己的本机做修改,然后点SAVE保存修改。在ubuntu中ctr+alt+t打开终端,输入。如果有版本输出则安装成功。在弹出的文本框最下面键入。原创 2023-05-31 10:20:41 · 6368 阅读 · 0 评论 -
conda、pip换源总结
将某个源的地址添加到channels中。进入编辑模式,编辑完成后按ESC,输入。修改conda配置文件。通过配置文件的形式更换源。原创 2023-05-31 10:17:25 · 3123 阅读 · 0 评论 -
3D目标检测论文阅读:BEVFusion4D
将激光雷达和相机信息整合到BEV (Bird - eye - view)中已成为自动驾驶中三维目标检测的重要课题。现有的方法大多采用独立的双分支框架来生成激光雷达和相机的BEV,然后进行自适应模态融合。由于点云提供了更精确的定位和几何信息,因此在从图像中获取相关语义信息之前,点云可以作为可靠的空间信息。因此,我们设计了一种激光雷达引导的视图转换器(LGVT),以有效地获得BEV空间中的相机表示,从而有利于整个双支路融合系统。原创 2023-05-29 14:36:55 · 475 阅读 · 1 评论 -
3D车道线检测论文阅读:3DLaneNet
我们介绍一种网络,可以直接从单张图像中预测道路场景中车道的3D布局。这项工作标志着在不假设已知恒定车道宽度或依赖预映射环境的情况下,首次尝试用车载视觉传感解决这一任务。我们的网络架构3D-LaneNet应用了两个新概念:网络内部的逆透视映射(IPM)和基于锚点anchor的车道表示。网络内的IPM投影促进了常规图像视图和顶视图的双重表示信息流。每列anchor输出表示使我们的端到端方法取代了常见的启发式方法,如聚类和异常值排除,将车道估计作为对象检测问题。原创 2023-05-29 14:31:01 · 524 阅读 · 3 评论 -
以栅格为中心的自动驾驶交通场景感知综述
以栅格为中心的感知是移动机器人感知和导航的一个关键领域。然而,在自动驾驶中,以栅格为中心的感知不如以对象为中心的感知那么普遍,因为自动驾驶汽车需要准确地感知高度动态的大规模室外交通场景,并且以栅格为中心的感知的复杂性和计算成本很高。深度学习技术和硬件的快速发展为以栅格为中心的感知的演变提供了新的见解,并使许多实时算法的部署成为可能。目前的工业和学术研究表明,以栅格为中心的感知具有巨大的优势,如全面的细粒度环境表示、更强的遮挡鲁棒性、更高效的传感器融合和更安全的规划策略。原创 2023-03-10 09:20:58 · 1475 阅读 · 0 评论 -
使用cityscapes数据集建立yolov7测试集
测试集的建立对评价模型好坏非常重要,本文使用cityscapes数据集,对其分割标签进行转换得到目标检测标签,并建立yolov7测试集,对训练的模型进行测试。原创 2022-09-07 18:56:44 · 2172 阅读 · 5 评论 -
深度学习目标检测模型测试评价指标的选取及介绍
自动驾驶的一大前提是保证人的安全,故对人的检测是必须的。考虑到自动驾驶的场景需求,各类车辆、交通灯、交通标志以及其他路上高频出现的,对决策有影响的物体类别都应进行识别,例如摩托车、自行车等。测试指标对评估模型性能好坏有着至关重要的意义,目前已有大量相关研究,本文对在工程中选取的指标做出总结,并介绍了目前比较主流的各类评价指标。原创 2022-09-06 14:56:06 · 5632 阅读 · 2 评论 -
yolov7训练BDD100k自动驾驶环境感知2D框检测模型
近日,伯克利AI实验室发表了CV领域到目前为止规模最大、最多样化的开源视频数据集–BDD100K数据集。该数据集由100000个视频组成,每个视频大约40秒,720P,30fps,总时间超过1,100小时,视频序列还包括GPS位置、IMU数据和时间戳;视频带有由手机记录的GPS/IMU信息,以显示粗略的驾驶轨迹,这些视频分别是从美国不同的地方收集的,如上图所示,该数据库,涵盖了不同的天气状况,包含晴天、阴天和雨天以及在白天和夜天的不同时间。原创 2022-09-05 17:11:52 · 3622 阅读 · 20 评论 -
BEVFormer论文翻译校对版
3D视觉感知任务,包括基于多摄像机图像的3D检测和地图分割,对于自动驾驶系统至关重要。在这项工作中,我们提出了一个新的框架,称为BEVFormer,它使用时空变换器学习统一的BEV表示,以支持多个自主驾驶感知任务。简而言之,BEVFormer通过预定义的网格形状的BEV queries与空间和时间进行交互,从而利用空间和时间信息。为了聚集空间信息,我们设计了一个空间交叉注意力,每个BEV查询从摄像机视图中的感兴趣区域提取空间特征。对于时间信息,我们提出了一种时间自注意力来递归地融合历史BEV信息。原创 2022-08-22 11:59:39 · 1294 阅读 · 0 评论 -
Transformer流程解析及细节思考
Transformer内容详解原创 2022-08-18 17:39:44 · 1268 阅读 · 0 评论