![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 76
naca yu
拧过螺丝,焊过板子的AI调参侠,对多模态融合感知有浓厚兴趣,交流请看文章-置顶,欢迎友好探讨各类问题
展开
-
MMDetection3D之DETR3D源码解析:整体流程篇
DETR3D原创 2022-06-14 18:57:50 · 2189 阅读 · 1 评论 -
RetinaNet损失函数源码解读
RetinaNet背景RetinaNet算法源自2018年Facebook AI Research的论文 Focal Loss for Dense Object Detection,作者包括了Ross大神、Kaiming大神和Piotr大神。该论文最大的贡献在于提出了Focal Loss用于解决类别不均衡问题,从而创造了RetinaNet(One Stage目标检测算法)这个精度超越经典Two Stage的Faster-RCNN的目标检测网络。模型结构:最后输出三层不同尺度的特征层:C3,C4,原创 2022-05-25 19:48:34 · 1055 阅读 · 0 评论 -
DETR损失函数源码解读
DETR损失函数原理DETR将set-prediction和transformer结构引入目标检测中,可以说是目标检测任务中不可避免的一种检测新范式,现在的许多3D检测等仍然借鉴了这一思路。对于DETR这种set-prediction model来说,最重要莫过于损失函数的构建,其中匈牙利算法作为正样本匹配的核心算法也就是损失计算的来源,其实现思路值得我们深入阅读。其中:σi\sigma_iσi作为样本匹配中的预测值索引,NNN 是queries的个数,yi=(ci,bi)y_i = (c原创 2022-05-25 10:53:01 · 1760 阅读 · 0 评论 -
自动驾驶CRUW数据集(大型毫米波频域图数据集)
目前是唯一一个开源的、多场景的、大型雷达频域图像检测数据集论文:Rethinking of Radar’s Role: A Camera-Radar Dataset and Systematic原创 2022-04-28 20:21:26 · 2767 阅读 · 8 评论 -
Transfuser(CVPR2021)基于全局注意力的端到端自动驾驶路径规划:主干网络源码解析
transfuser原创 2022-04-27 16:23:12 · 1496 阅读 · 1 评论 -
视觉注意力(vision transformer)的可解释性
解决问题创新点方法细节注意力分布图u求解U求解动态感受野原创 2022-03-19 12:07:03 · 5006 阅读 · 0 评论 -
计算机视觉中的编码-解码器结构总结(持续更新)
视觉领域中的编码解码器结构原创 2022-03-16 22:00:51 · 16068 阅读 · 0 评论 -
A Survey on Vision Transformer(视觉注意力机制的前沿与作用机制分析综述-持续更新)
注意力前沿工作机制原创 2022-03-15 17:37:30 · 4182 阅读 · 2 评论 -
多传感器融合目标检测系列:CenterFusion(基于CenterNet)源码深度解读: :DLA34 (四)
CenterNet与Centerfusion结构解析原创 2022-03-05 16:16:59 · 10312 阅读 · 3 评论 -
CenterFusion(多传感器融合目标检测网络)与自动驾驶数据集nuScenes:模型的数据加载(三)
模型加载原创 2022-03-01 16:57:47 · 4780 阅读 · 7 评论 -
nuScenes自动驾驶数据集:格式转换,模型的数据加载(二)
自动驾驶数据集解析原创 2022-02-27 22:59:32 · 5179 阅读 · 1 评论 -
关于Kaggle打开GPU加速需要手机验证的问题及解决方案
问题解决原创 2022-02-24 10:00:15 · 3609 阅读 · 0 评论 -
DCNv2在pytorch1.8.1的安装(经过测试)
我的电脑环境项目名称版本cuda版本11.1pytorch版本1.8.1ubuntu版本18.04在安装centerFusion(centerNet的多模态融合版本)时,遇到DCNv2不支持新版pytorch的问题,通过寻找其他博客,发现他们只找到了pytorch1.7的新版本,我测试适用于1.7的,也报了各种错,直到我找到了DCNv2某位大佬写的最新版,但是在安装的过程中,出现了很多问题,最后经过我的略微修改,可以运行了。安装流程#到你的路径上git c原创 2022-01-20 21:57:37 · 6170 阅读 · 10 评论 -
多模态深度学习综述总结 与 目标检测多模态融合领域论文推荐
模态定位为某种类型的信息,如声音、图像、文字等。人们生活在一个多模态相互交融的环境中,生活中的各项决策都考虑了至少两种方面的信息。对单模态信息的学习上,每种模态的异构性决定了其存在不同的学习模型。虽然单模态学习在如今已经取得了显著的进步,在图像单模态的目标检测,文字识别领域等实现了较高的准确率,但是在一些其他领域:例如视频检索、图像语义理解等方面,单模态难以进行处理。原创 2022-01-19 23:00:16 · 8971 阅读 · 5 评论 -
机器学习-归纳偏好(西瓜书系列1)
每一种算法都带有一种归纳偏好,归纳偏好,可以理解为算法对于某种假设的偏好,这种偏好可以体现为线性回归模型对于模型线性的假设偏好等。奥卡姆剃刀原理关于归纳偏好,对于一个数据,模型有许多的归纳偏好,也就是有许多的假设,那么如何进行归纳假设的选择呢,一般性的原则就是:最简单原则-奥卡姆剃刀原理,也就是使模型的结构尽量简单,这也是《统计学习》中提到的结构风险最小化。简单有什么好处呢,其中之一就是具有良好的泛化性,如果结构过于复杂,会产生过拟合的现象。NFL(没有免费的午餐)如图,见详情可见原创 2021-12-23 22:53:20 · 2281 阅读 · 1 评论 -
视觉Transformer开山之作:Vision Transformer(ViT)论文解读与复现
介绍了VIT的结构及其复现原创 2021-12-17 23:30:08 · 5119 阅读 · 2 评论 -
深度学习中对tensor向量进行维度调整的常用方法总结reshape()、transpose()、unsqueeze()
在炼丹日常,很多模型为了保持tensor的计算便利和维度统一(例如resnet)会涉及到很多的维度转换,这时候很容易就绕晕,在参加飞浆的transformer课程中,学习了很多灵活变化维度的方法,这些方法能够让我们减少相当一部分的维度转换的复杂度。下面逐个介绍常用的维度转换方法:reshape方法:维度重整简单的reshape方法我们就不进行介绍,主要介绍reshape中-1的灵活运用,我们可以轻松的避免一些计算。import paddleimport paddle.nn as nn原创 2021-12-16 22:16:49 · 8800 阅读 · 3 评论 -
LabelImg的安装与使用(Anaconda环境)
LabelImg的安装与使用(Anaconda环境)Labellmg的安装下载与配置Ananconda环境使用Jupyter notebook配置labellmg环境(也可以使用tensorflow环境)如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入Labellmg的安原创 2021-05-07 23:04:21 · 5945 阅读 · 1 评论 -
深蓝学院目标检测课程Detectron中train.py的模型无法下载问题
深蓝学院pycharm中,在配置好环境后,原创 2021-11-15 11:09:34 · 3229 阅读 · 0 评论 -
深度学习之局部连接与权值共享
在网络中,如果全部使用全连接网络,则会使参数异常多,造成计算复杂,降低训练的效率。由此引入卷积层,卷积层能够有效减小训练参数,这与卷积具有的两个性质有关。结合自身经历以及他人的疑问,对卷积神经网络有一个误解:每个卷积核产生的feature map为一个神经元,正确的认知应该是每个神经元代表feature map的一个像素;**卷积层有两个比较重要的性质:**1 局部连接图1.全连接与卷积图2.卷积示意图如图所示,5×5为L层,3×3为L+1层,其中L+1层单元格值为6、10的两个格子,两原创 2021-09-10 22:17:02 · 2855 阅读 · 5 评论