栀子清茶-CSDN博客

原创 ITCFN: INCOMPLETE TRIPLE-MODAL CO-ATTENTION FUSION NETWORK FOR MILDCOGNITIVE IMPAIRMENT CONVERSION

图 1 : ITCFN的整体架构。(a)描述网络流程，包括缺失多模态数据、特征提取、多模态融合和损失函数的解决方案。(b) MMG模块基于MRI生成缺失的PET数据。(c) TCAF模块促进多模式融合。在这项研究中，本文提出了一种称为ITCFN的创新方法来预测MCI的转换。ITCFN方法结合了MRI、PET和临床特征，通过MMG模块有效地管理缺失的PET数据，并通过TCAF模块实现模态融合。与传统的单模态方法和其他多模态深度学习技术相比，该模型表现出优越的分类性能。

2025-04-20 21:32:23 875

原创 Tmi-clnet:从影像学、临床和放射学数据融合判断慢性肝病预后的三模态相互作用网络——医学图像论文学习，论文&源码下载

本研究提出了TMI-CLNet，该网络整合了CT影像学、放射学特征和临床信息，为慢性肝病患者提供早期预后评估。通过引入TCAF模块和TMFF损失函数，该模型可以解决不同模态之间的异质性，从而取得了显著的性能。实验结果证明了该方法的有效性。在未来，可以将重点扩展数据集，进行多中心验证，提高计算效率，以增强模型的鲁棒性和可扩展性。此外，本研究的方法提供了一个有价值的视角，可以扩展到其他疾病或模式，使其适合未来在不同领域的各种应用。

2025-04-15 21:20:37 922

原创 GAN生成式网络：Generative Adversarial Nets

输入一组随机向量，就可以在G生成一张图，通过D对生成的这张图进行打分，这就是DG系统的前向过程。它的输入参数是x，x代表一张图片，输出D（x）代表x为真实图片的概率，如果为1，就代表100%是真实的图片，而输出为0，就代表不可能是真实的图片。过程：G是一个生成图片的网络，它接收一个随机的噪声z，通过这个噪声生成图片，记做G(z)。中出现的许多复杂的概率计算，得到的结果难以近似，所以关于图像生成的任务表现一直都不太好。详细解释：判断这张图像是真实的还是机器生成的，目的是找出生成器做的“假数据”。

2025-04-12 14:38:55 691

原创 Towards Universal Soccer Video Understanding——论文学习（足球类）

在这篇论文中，建立了一个统一的、可扩展的足球理解多模态框架。具体来说，本文介绍了SoccerReplay-1988，这是迄今为止最大、最全面的足球视频数据集，由自动管理管道注释。这为开发多模式足球理解模型提供了坚实的基础，并成为一个更具挑战性的基准。在此基础上，本文开发了第一个足球视觉语言基础模型，称为MatchVision，它有效地利用了足球视频中的时空信息，可以应用于各种任务，如事件分类和评论生成。

2025-03-16 17:58:37 1382

原创 A Survey of Deep Learning in Sports Applications:Perception, Comprehension, and Decision——论文学习（足球综述）

本文对深度学习在运动表现中的应用进行了全面调查，重点关注三个主要方面：算法、数据集和虚拟环境以及挑战。首先，讨论了深度学习算法在运动表现中的层次结构，包括感知、理解和决策，同时比较了它们的优缺点。其次，列出了体育领域广泛使用的现有数据集，并强调了它们的特点和局限性。最后，总结了当前的挑战并指出了体育深度学习的未来趋势。本文系统性地构建了深度学习在体育应用中的技术框架，覆盖从底层感知到高层决策的全链条，并指出当前研究的瓶颈（如数据异构性、算法泛化性）。

2025-03-14 19:09:13 867

原创 MAE：Masked Autoencoders Are Scalable Vision Learners——论文学习

图 2 ImageNet验证图像的示例结果Masking。根据ViT，本文将图像划分为规则的不重叠的小块。然后对patch的子集进行采样，并掩码(即删除)剩余的patch。本文的采样策略很简单：对随机斑块进行采样，不进行替换，遵循均匀分布。简单地称之为“随机抽样”。如图 3 所示，“随机抽样”的效果最好。具有高掩蔽比(即去除斑块的比例)的随机采样在很大程度上消除了冗余，从而创建了一个不能通过从可见的邻近斑块外推轻松解决的任务(见图2 - 4)。

2025-03-13 21:42:54 772

原创 MobileMamba: Lightweight Multi-Receptive Visual Mamba Network——论文笔记

图 4 MobileMamba概述。(a) MobileMamba的架构。(c) MobileMamba块结构。(d)细粒度设计。提出了高效的多感受野特征交互(MRFFI)模块。

2025-03-07 22:14:13 1213 1

原创 DeepLab V1-V3的结构和关系

DeepLab系列模型在每一代都逐步增强了多尺度处理能力和全局上下文的理解。V1适合于基础的分割任务，V2在多尺度和边界优化上有所突破，而V3则进一步摆脱了后处理步骤，通过ASPP和全局特征的结合达到了较高的性能。DeepLabV1网络简介(语义分割)_哔哩哔哩_bilibiliDeepLabV2网络简介(语义分割)_哔哩哔哩_bilibiliDeepLabV3网络简介(语义分割)_哔哩哔哩_bilibili。

2024-10-31 15:22:53 830

原创 SegNet & DeconvNet——论文阅读

此前的语义分割方法主要基于全卷积网络 (Fully Convolutional Networks, FCN)，这种方法通过卷积层逐渐下采样并生成粗略的标签映射，随后用双线性插值或条件随机场 (CRF) 进行细化。DeconvNet 引入了逆卷积网络 (Deconvolution Network)，旨在解决上述问题，以实现更加精细的语义分割效果。

2024-10-28 16:03:43 1091 1

原创 U-net医学分割网络——学习笔记

扩展路径中的每一步都包括特征映射的上采样，然后进行2x2卷积(“上卷积”)，将特征通道的数量减半，与收缩路径中相应裁剪的特征映射进行连接，以及两个3x3卷积，每个卷积后面都有一个ReLU。由于在每次卷积中边界像素的损失，裁剪是必要的。总体来说，U-Net 适合需要高精度和上下文信息丰富的分割任务，尤其在数据有限的医学图像领域有很大优势，但在复杂环境和边界处理上仍有改进空间。：U-Net 的对称结构结合了上下文信息和高分辨率特征，能够精确定位每个像素的类别，适用于需要高精度的分割任务。

2024-10-27 17:15:34 833

原创 FCN深度学习语义分割开山之作——学习笔记

Fully Convolutional Networks for Semantic Segmentation》提出了，可直接处理任意大小的输入图像并输出相应大小的预测结果，超过了现有技术水平。

2024-10-26 22:53:25 933

原创 A survey on instance segmentation: state of the art——论文笔记

第一部分“简介”主要介绍了实例分割的背景、定义和挑战。1、背景1、检测框架的对比。

2024-10-25 10:56:30 1263 1

原创 A survey of loss functions for semantic segmentation——论文笔记

语义分割的重要性：语义分割被定义为一种像素级别的分类任务，即将图像中的每个像素分配给不同的类别。这项技术在许多领域有着广泛的应用，包括自动疾病检测和自动驾驶等。通过语义分割，不仅可以检测出疾病的存在，还可以精确定位其位置，在医学影像中尤其有用，例如检测肿瘤或病灶。损失函数的作用：在深度学习模型中，损失函数用于引导算法的学习过程，因此选择合适的损失函数对于设计复杂的语义分割模型至关重要。自2012年以来，研究人员已经开发了多种特定领域的损失函数，以提升模型在不同数据集上的表现。损失函数的分类。

2024-10-24 21:21:46 1110 1

原创 Unsupervised Domain Adaptation in SemanticSegmentation: A Review——论文笔记

该部分首先定义了问题的数学表达形式。语义分割和图像分类可以视作寻找从输入空间（图像）到输出空间（标签或语义地图）的映射问题。无监督域适应（UDA）的核心是在源域和目标域分布不同的情况下，利用源域的有标注数据，去推断目标域的无标注数据的类别分布。

2024-10-24 10:43:41 1204 1

原创 A Survey on Deep Learning Methods for Semantic Image Segmentation in Real-Time——论文笔记

概述：这一部分提供了表现最佳模型的总结表格，特别是基于Cityscapes数据集进行评估的模型。在大多数语义分割研究中，计算效率不是主要关注点，因此本节主要关注在Cityscapes数据集上的表现最好的模型。表2总结了在mIoU指标上表现最好的前十个模型，并简要介绍了这些模型使用的技术方法。实时分割模型：表3则对一些实时语义分割模型进行了排名，按照推理速度（每秒帧数，FPS）进行排序。该表显示了一些模型在高FPS下依然保持较好的mIoU表现，展示了性能与效率的权衡。近期进展。

2024-10-22 21:28:21 854 1

原创 Image Segmentation Using Deep Learning: A Survey——论文笔记

编码器将输入图像转换为低维的特征表示，而解码器则通过逐步上采样的方式恢复图像的空间信息。这种架构通常用于像素级的预测任务，如图像分割。

2024-10-21 21:40:30 1122 1

原创 MMDetection环境配置——学习笔记

注意：在MMCV-v2.x中，MMCV full被重命名为MMCV，如果你想在没有CUDA操作的情况下安装MMCV，你可以使用mim install“MMCV-lite>=2.0.0rc1”来安装lite版本。创建环境：conda create --name mmdetection python=3.8 -y #mmdetection为环境名。，选择合适的conda版本，然后复制红色框框的命令，到Anaconda Prompt运行，如下图演示。#“-e”表示以可编辑模式安装项目，

2024-10-18 17:57:18 581

原创端对端的transformer目标检测——论文总结笔记

假设有两个集合，一个集合是“任务”，另一个集合是“工人”，每个任务由某个工人执行会产生不同的代价，算法的目标是找到一种匹配方式，使得总代价最小。找到矩阵中没有被覆盖的最小元素，将其从所有未覆盖的元素中减去，并加到被两条直线覆盖的元素上。：传统的锚点框（anchor boxes）用于覆盖不同尺寸和长宽比的对象，DETR完全摆脱了锚点框的设计，而是通过解码器中的查询直接预测对象。DETR不仅适用于物体检测任务，还可以扩展到全景分割任务，通过添加简单的分割头，达到了在全景分割中的竞争性表现。

2024-10-18 11:15:39 628

原创 YoLov5进阶——学习笔记

打开VSCode，在终端激活对应的环境并输入以下命令：下载YOLOv8的代码拿来借鉴，地址如下：https://github.com/ultralytics/ultralytics下载好后解压，打开下图目录，双击打开block1文件：在block.py中找到C2f模块复制，打开YOLOv5的common.py文件，粘贴进去：我们发现C2f中有Bottleneck模块，所以把Bottleneck模块也copy过来，为了避免覆盖之前yolov5的块，我们把copy过来的模块加上了前缀：在yolov5的yolo

2024-10-18 09:56:56 1231

qq_55009448的博客

原创 ITCFN: INCOMPLETE TRIPLE-MODAL CO-ATTENTION FUSION NETWORK FOR MILDCOGNITIVE IMPAIRMENT CONVERSION

原创 Tmi-clnet:从影像学、临床和放射学数据融合判断慢性肝病预后的三模态相互作用网络——医学图像论文学习，论文&源码下载

原创 GAN生成式网络：Generative Adversarial Nets

原创 Towards Universal Soccer Video Understanding——论文学习（足球类）

原创 A Survey of Deep Learning in Sports Applications:Perception, Comprehension, and Decision——论文学习（足球综述）

原创 MAE：Masked Autoencoders Are Scalable Vision Learners——论文学习

原创 MobileMamba: Lightweight Multi-Receptive Visual Mamba Network——论文笔记

原创 DeepLab V1-V3的结构和关系

原创 SegNet & DeconvNet——论文阅读

原创 U-net医学分割网络——学习笔记

原创 FCN深度学习语义分割开山之作——学习笔记

原创 A survey on instance segmentation: state of the art——论文笔记

原创 A survey of loss functions for semantic segmentation——论文笔记

原创 Unsupervised Domain Adaptation in SemanticSegmentation: A Review——论文笔记

原创 A Survey on Deep Learning Methods for Semantic Image Segmentation in Real-Time——论文笔记

原创 Image Segmentation Using Deep Learning: A Survey——论文笔记

原创 MMDetection环境配置——学习笔记

原创端对端的transformer目标检测——论文总结笔记

原创 YoLov5进阶——学习笔记

原创 Fast R-CNN论文——学习笔记

原创 YOLOv5模型训练常见问题 & YOLOv5 Pyside6可视化界面——学习笔记

原创 YOLOv5模型检测——学习笔记

原创 YOLOv5环境安装及问题解决

原创 swin transformer及其进化过程——学习笔记

原创 YoLov1目标检测——知识点笔记

原创 YOLOv1~YOLOv3理论学习——知识笔记

原创 Transformer架构详解，一文看懂不是梦！！！

原创创建虚拟环境及Pytorch安装（保姆级教程！！！）

原创深度学习基础

空空如也

空空如也