深度学习
文章平均质量分 90
得逞
这个作者很懒,什么都没留下…
展开
-
【论文阅读】DETR 论文逐段精读
目标检测领域:从目标检测开始火到 detr 都很少有端到端的方法,大部分方法最后至少需要后处理操作(NMS, non-maximum suppression 非极大值抑制)。有了 NMS,模型调参就会很复杂,而且即使训练好了一个模型,部署起来也非常困难(NMS 不是所有硬件都支持)。贡献:把目标检测做成一个端到端的框架,把之前特别依赖人的先验知识的部分删掉了(NMS 部分、anchor)。DETR提出。原创 2024-04-02 00:14:01 · 1111 阅读 · 1 评论 -
【论文阅读】Transformer 论文逐段精读
主流的序列转录模型包括一个 encoder 和一个 decoder 的 RNN 或者 CNN 架构。sequence transduction: 序列转录,序列到序列的生成。input 一个序列,output 一个序列。e.g. 机器翻译:输入一句中文,输出一句英文。表现好的序列转录模型:用了 attention,本文提出仅仅基于 attention 的 Transformer。实验总结 - 并行化、更少时间训练。2 个机器翻译任务的实验结果达到 SOTA。并且能很好的泛化到其他任务。原创 2024-04-02 00:09:08 · 2635 阅读 · 2 评论 -
【深度学习】YOLO检测器家族所有版本(2024最新汇总、详细介绍)
YOLO检测器的发展历程展示了计算机视觉领域在实时对象检测方面的快速进步。从YOLOv1到YOLOv5,我们看到了速度和准确性的不断提升,以及对不同应用场景的适应性。随着技术的不断发展,我们期待YOLO检测器在未来能够带来更多的创新和突破。原创 2024-03-28 23:56:53 · 1244 阅读 · 0 评论 -
【深度学习】线性回归
梯度下降最简单的用法是计算损失函数(数据集中所有样本的损失均值) 关于模型参数的导数(在这里也可以称为梯度)。,它是由固定数量的训练样本组成的。然后,我们计算小批量的平均损失关于模型参数的导数(也可以称为梯度)。(sample),也可以称为数据点(data point)或数据样本(data instance)。在机器学习领域,我们通常使用的是高维数据集,建模时采用线性代数表示法会比较方便。事实上,更难做到的是找到一组参数,这组参数能够在我们从未见过的数据上实现较低的损失,这一挑战被称为。原创 2024-03-19 16:29:26 · 605 阅读 · 0 评论 -
【深度学习】NestedTensors
比如 masks 大小为 (1, 800, 1440),tensor 大小为 (1, 3, 800, 1440)。例如,在一批句子中,每个句子都有不同数量的单词。处理变化序列的一种常见技术是手动将每个数据张量填充到相同的形状,以形成一个批。,那么 batch 中的每一张图都有一个 mask 矩阵,在 img 有值的地方是 1,补零的地方是 0。例如,我们有两个不同长度的句子和一个词汇表。为了将其表示为单个张量,我们将 0 填充到批中的最大长度。当数据是连续的时,通常情况下每个样本都有不同的长度。原创 2024-03-19 10:31:10 · 452 阅读 · 0 评论 -
【深度学习】入门预备知识大全
调用求和函数会沿所有的轴降低张量的维度,使它变为一个标量。然而,虽然这些更奇特的对象确实出现在高级机器学习中(包括深度学习中),但当调用向量的反向计算时,我们通常会试图计算一批训练样本中每个组成部分的损失函数的导数。使用自动微分的一个好处是: 即使构建函数的计算图需要通过 Python 控制流(例如,条件、循环或任意函数调用),我们仍然可以计算得到的变量的梯度。X 、Y 形状均为(3,4),沿行(轴-0,形状的第一个元素) 和按列(轴-1,形状的第二个元素)连结分别得到(6,4)以及(3,8)。原创 2024-03-13 22:50:53 · 805 阅读 · 0 评论