视觉与网络_一杯水果茶！的博客-CSDN博客

视觉与网络

关注

文章平均质量分 91

计算机视觉、机器学习、深度学习、神经网络相关的论文解读和相关概念理解。

关注数：文章数：13 文章阅读量：21078 文章收藏量：234

作者: 一杯水果茶！

浪迹江湖，特立独行。潇洒不羁，厌恶世俗。有礼有节，待人真诚。认真专注，热爱学习。尊师重道，不耻下问。有品位，有格调。感兴趣的事无论如何也要去做，不感兴趣的事谁说也没用。

展开

LabelEncoder 类属性类方法及用法

将类别变量（例如字符串标签或离散的整数标签）转换为整数。

原创 2024-06-25 12:36:22 · 758 阅读 · 0 评论
输入通道数和输出通道数的理解

输入通道数（in_channels）通常指的是输入数据的深度或者特征的数量。输出通道数，即卷积核（滤波器 Filter）的个数。每个卷积核可以提取一种特征，并得到一张新的特征图。out_channels 表示卷积层中卷积核的数量，也就是提取特征的数量。

原创 2023-11-29 22:22:20 · 2871 阅读 · 0 评论
神经网络模型训练中的相关概念：Epoch，Batch，Batch size，Iteration

神经网络模型训练中的相关概念：Epoch，Batch，Batch size，Iteration

原创 2023-12-06 11:31:40 · 8657 阅读 · 3 评论
卷积的理解，卷积与通道的关系

卷积核通道个数 = 输入通道个数卷积核的内核个数 = 卷积核通道个数，一个通道对应一个内核输出通道个数 = 卷积核个数

原创 2023-11-30 11:29:46 · 1085 阅读 · 2 评论
滤波器、卷积核与内核的关系

滤波器（filter）也叫卷积核，过滤器。是一个三维立方体，长× 宽 × 深度，其中深度便是由多少张内核构成，与输入层的深度一致。深度即通道数，这一个卷积核会根据输入通道数（in_channels）来扩展，变成具有输入通道数（in_channels）张内核的卷积核。

原创 2023-11-30 11:31:19 · 468 阅读 · 0 评论
深度学习及其基本原理

深度学习逻辑是：首先提取低级特征，然后对低级特征不断地在更高的级别上进行排列组合，并寻找组合后的有用信息。在足够深、足够宽（指神经网络中有足够多的神经元）的情况下，深度神经网络具有足够的表达能力，可以逼近连续函数的任何形状。这是因为深度神经网络的层次结构允许它学习复杂的特征和表示。

原创 2023-11-28 00:20:13 · 703 阅读 · 0 评论
类比 C 冒泡排序，从 ctrgcn.py 看神经网络模型代码

为了搞清楚神经网络中的代码行文思路，本文用图神经网络中的 CTR-GCN 的源码，类比之前学过的 C 语言的冒泡排序代码，看看其代码行文思路的相同之处。

原创 2023-12-06 11:33:17 · 134 阅读 · 0 评论
常见的类 nn.Conv2d，nn.BatchNorm2D，nn.AdaptiveAvgPool2d

常见的类 nn.Conv2d，nn.BatchNorm2D，nn.AdaptiveAvgPool2d

原创 2023-11-30 11:37:08 · 1126 阅读 · 0 评论
分割掩模 VS 掩膜

分割掩模是一种图像处理的技术，它可以将图像中的不同对象分离出来，生成对应的二值图或多值图，表示每个对象的位置和形状。掩膜是一种用于覆盖或遮挡图像的特定图像，它可以控制图像处理的区域。分割掩模和掩膜的联系是，分割掩模可以作为掩膜的一种输入，用于提取或裁剪图像中的特定区域。

原创 2023-11-29 22:24:23 · 1767 阅读 · 1 评论
上游任务和下游任务

上游任务上进行预训练，网络能够学到通用的特征，然后通过微调，这些通用特征能够被定制为适应特定的下游任务。大规模数据集的上游任务通常能够为模型提供强大的泛化能力，而相对较小的数据集的下游任务则能够使模型更适应特定的应用场景。

原创 2023-11-28 01:11:23 · 1255 阅读 · 0 评论
ResNet 原论文及原作者讲解

ResNet 原论文及原作者讲解

原创 2023-12-19 09:54:42 · 1803 阅读 · 0 评论
MDETR 论文解读

MDETR - Modulated Detection for End-to-End Multi-Modal Understanding 是一篇发表在年上的论文，它提出了一种基于最新 DETR 检测框架的端到端调制检测器，将对象检测和自然语言理解整合到一个统一的端到端框架中，实现真正的端到端多模态推理。

原创 2023-12-03 22:40:09 · 236 阅读 · 0 评论
MDETR 论文翻译及理解

MDETR，这是一种端到端调制检测器，它可以根据一个原始文本查询（如一个标题或一个问题）来检测图像中的对象。

原创 2023-12-03 22:42:10 · 231 阅读 · 0 评论

视觉与网络

作者: 一杯水果茶！

LabelEncoder 类属性类方法及用法

输入通道数 和 输出通道数 的理解

神经网络模型训练中的相关概念：Epoch，Batch，Batch size，Iteration

卷积的理解，卷积与通道的关系

滤波器、卷积核与内核的关系

深度学习及其基本原理

类比 C 冒泡排序，从 ctrgcn.py 看神经网络模型代码

常见的类 nn.Conv2d，nn.BatchNorm2D，nn.AdaptiveAvgPool2d

分割掩模 VS 掩膜

上游任务和下游任务

ResNet 原论文及原作者讲解

MDETR 论文解读

MDETR 论文翻译及理解

输入通道数和输出通道数的理解