WTIAW.TIAW-CSDN博客

原创 2021蓝桥杯Java复习【史上最详细攻略】【持续更新】

Java排序交叉排序import java.math.BigInteger;import java.util.Arrays;import java.util.Comparator;import java.util.Scanner;public class Main { public static void main(String[] args) { Scanner cin = new Scanner(System.in); Integer a[]; Integer n = cin

2020-10-04 18:02:08 29198 13

原创 Sign-IDD: Iconicity Disentangled Diffusion for Sign Language Productio 论文解读

总而言之，Sign-IDD论文的算法流程本质上是一个条件扩散模型，但其精髓在于通过“标志性解耦”这一创新，引入了更符合人体物理结构的4D骨骼表示，并设计了“属性可控的”ACD模块来驾驭这种新表示。这使得模型不再是盲目地拟合3D坐标点，而是学会了理解和遵循人体的骨骼结构来生成动作，从而让最终生成的手语姿态在细节上更准确，动作更自然、连贯。

2025-08-19 10:36:09 1029

原创 Diffusion Model 扩散模型

使用一个模型预测噪声。敲黑板 (训练流程)

2025-08-08 01:50:06 270

原创 windows 命令行高效、快速压缩/解压缩文件

【代码】windows 命令行高效、快速压缩/解压缩文件。

2025-05-11 22:32:06 622

原创如何使用clip模型进行OOD

使用CLIP模型进行OOD检测（Out-of-Distribution Detection) 的核心思路是：利用CLIP的多模态对齐能力（图像和文本的联合嵌入空间），通过计算输入样本与已知类别语义的匹配度，判断其是否属于已知分布。CLIP的OOD检测原理CLIP（Contrastive Language-Image Pretraining）通过对比学习将图像和文本映射到同一语义空间。在OOD检测中，可以：CLIP的核心思想是将图像和文本映射到同一语义空间，使匹配的图文对在嵌入空间中距离接近，不匹配的远离。

2025-03-01 19:58:25 689

原创 AI训练中的常用指令

【代码】AI训练中的常用指令。

2025-02-20 19:32:20 656

原创人工智能+医学

图像分类、语义分割、疾病预测、目标检测、图像配准、图像生成(应用少)、图像增强、生成放射学报告。需要有很强的可解释性。

2024-10-24 22:20:39 415

原创多模态大模型调研BLIP、BLIP2、InstructBLIP

这张表格总结了在不同任务（如图像描述、视觉问答、视觉问题生成）中，如何向大语言模型提供不同形式的指令模板。每个任务的指令稍有不同，以适应任务要求。例如，图像描述任务要求生成简短的描述，视觉问答则要求根据图像回答问题，而视觉问题生成任务则要求模型根据图像和预设答案生成问题。这些指令模板有助于增强模型的多任务处理能力，使其能够更好地理解和执行不同的视觉相关任务。

2024-10-07 18:33:16 1210

原创多模态大模型调研

NLP与CV的区分是历史阶段性的产物，有了vit/transformer之后，两者的区分不再明显。Glip 应用于目标检测。Clip的泛化能力超强。

2024-10-04 17:25:22 386

原创 SLAM学习-VO视觉里程计

当你开车经过一排房屋时，视觉里程计就像是一个聪明的助手，它会观察连续的图像：在第一帧中，房子在画面的右侧，而当你前进时，房子逐渐移向左侧。综上，视觉里程计通过分析连续图像来追踪相机的运动，就像玩游戏时摄像头根据场景的变化判断汽车的移动轨迹一样。视觉里程计通过连续拍摄的图像序列，提取出特征点（如角点、边缘等），并比较这些特征点在不同帧图像中的相对位置变化，来估算相机的运动轨迹。现在想象你突然转弯，视觉里程计会“看到”场景中的物体以不同角度出现，利用这种视角的变化，它能推测出你不仅前进了，还发生了旋转。

2024-09-23 15:08:29 718

原创两台服务器之间互传数据

scp 默认使用 SSH 协议的端口（通常是端口 22）。如果你需要指定一个不同的端口号，可以使用 -P 选项（注意是大写的 P）。

2024-09-11 15:16:49 366

原创如何使用命令行快速下载Google Drive/OneDrive大文件

OneDrive使用wget下载会出现403 forbidden，可通过下面方法下载。浏览器右键进入检查界面，选择netowork，搜索download.aspx，然后在待下载文件处点击下载，即可出现下载链接，复制为cURL即可下载。

2024-09-09 15:47:22 2280

原创科研习惯 [4] 学会表达

盯着对方的鼻子，而不是眼睛，可以避免get到对面眼神变化而造成的分心。比如，我们约定俗成的讲故事的逻辑，就是时间顺序，4.表达能力不够强的情况下，不要直视对方的眼睛。因为一问一答就无法深入。毫无准备的情况下，如然被cue到，就按。有效表达和胡说八道之间的区别在于是否有。2.让别人理解到你打算从哪方面论证观点。3.不要陷入人称代词把别人搞混的误区。3.具体论证重点：实践，实践，实践。

2024-09-03 14:58:13 334

原创什么是论点、论据、结论和提议

在构建论证时，通常的顺序是先提出论点，然后提供支持论点的论据，接着得出结论，并可能提出具体的提议或解决方案。这个过程有助于清晰、有逻辑地表达观点，并说服听众或读者接受你的观点。在逻辑和修辞学中，论点、论据、结论和提议是构建有效论证的基本要素。

2024-08-29 18:42:33 3567

原创科研习惯 [3] 博士需要培养的能力

每个点我分成高中初三个级别即总共90分为了方便理解默认本科毕业送基础分10分凑到100分。我粗算了一下对机器学习（偏理论和方法论不偏工程）大概30个技能点吧（可能增加）

2024-08-28 15:30:27 542

转载科研习惯 [2] 演讲的能力

还可以是看到的一部有趣的电影的叙述。很多人会觉得这似乎很简单，但是等到你开始做的时候，你会发现这跟你平时说话不太一样。你可能会发现原先你以为你可以流畅讲完的部分，会出现卡壳，会出现很多“恩，恩，啊，啊”的口头禅，总之，你会发现自己的各种各样的问题。通过这个练习，你会感觉到三分钟，你大概可以讲完多少内容，让你掌握演讲说话的感觉。同时，它也可以训练你的逻辑能力，比如利用三点式来回答问题，第一点，第二点，第三点，这是训练你结构化思维的一个不错的方式。

2024-08-28 15:21:56 247

原创科研习惯 [1] 什么是学术三问

研究者需要思考为什么选择这个课题，研究的科学意义、社会价值以及其对领域发展的贡献是什么。这一问主要是让研究者明确研究的对象、范围和核心问题。它要求研究者清晰地定义研究的目标和要解决的关键问题，避免研究的方向模糊不清。研究者需要考虑如何设计实验、收集数据、分析结果，并确保研究的科学性、可行性和创新性。“学术三问”是中国学术界的一种反思性提问方式，用于研究者在学术活动中思考其研究的基础性问题。通过“学术三问”，研究者能够更加全面地审视自己的研究项目，确保研究有明确的方向、实际的价值和科学的方法。

2024-08-28 14:37:20 507

原创 AI之路:linux下编辑代码常用指令tmux与vim|shell常用快捷键

在使用过程中，如果要做比较耗时的操作，例如有时候进行编译，或者下载大文件需要比较长的时间，一般情况下是下班之后直接运行希望第二天早上过来运行完成，这样就不用耽误工作时间。tmux刚好可以解决我们描述的问题，当我们在tmux中工作的时候，即使关掉SecureCRT的连接窗口，再次连接，进入tmux的会话我们之前的工作仍然在继续。会话有点像是tmux的服务，在后端运行，我们可以通过tmux命令创建这种服务，并且可以通过tmux命令查看，附加到后端运行的会话中。在命令模式下输入,可使用鼠标控制vi。

2024-04-23 21:57:53 1064

转载论文写作中Introduction与Related work的区别

a) 背景介绍、现状(介绍别人的研究)，存在的问题，怎样解决、我的做法、有何亮点b) 研究背景和重要性、引出该领域的科研空白、点题–指出本文的研究课题、概述文章的核心方法论和主要发现、提出猜想和研究目的。

2024-03-27 17:01:56 1633 1

原创深度学习绘制热力图heatmap、使模型具有可解释性

获取的特征图，然后根据特征图梯度计算出权重值，加在原图上面。

2024-03-20 14:12:47 3068

原创 Linux下新建用户

vi中，按i是输入模式，按esc退出编辑模式输入:wq!在user privilege这一行，仿照root，另起一行，添加上。找到新建用户名，将sh改为bash。

2024-02-03 18:56:35 597

原创学术科研常用工具

顶会（CVPR，ICCV，ECCV，Neurips，AAAI）顶刊（TPAMI，IJCV，TIP）arxiv学术速递 https://arxivdaily.com/top高校公开课：斯坦福，李宏毅课程，

2023-11-28 19:16:44 325

原创在深度迁移学习中，什么是源域，什么是目标域？

域迁移的目标是通过迁移源域中学到的知识和特征，在目标域上实现更好的泛化性能。在目标域中，通常有较少的标记样本可供学习，因此模型需要通过迁移学习来利用源域中学到的知识和特征，以便在目标任务上获得良好的性能表现。通过从源域到目标域的知识迁移，模型可以更好地适应目标域的特征和数据分布，从而提高在目标任务上的效果。因此，我们需要通过迁移学习的方式，将从源域学到的知识和特征应用到目标域上，以提高在目标域上的性能表现。总之，源域是用于训练模型的数据集或数据分布，而目标域是我们希望将模型应用于的新数据集或数据分布。

2023-09-30 17:08:28 11207 1

原创深度迁移学习(Deep Migration Learning)

深度迁移学习（Deep Transfer Learning）是一种在深度学习领域中应用的迁移学习方法，旨在通过利用从一个领域学习到的知识来改善在另一个相关但数据较少的领域上的学习任务。深度迁移学习常常使用预训练的深度神经网络模型，通过迁移已学习到的知识和特征来加快和优化在目标领域上的学习过程。深度迁移学习的优势在于它能够利用源领域丰富的数据和已学习到的知识来改善目标领域上的学习性能。**迁移知识：**在预训练完成后，可以利用已经学习到的模型参数和特征来进行迁移知识。

2023-09-30 16:28:07 2216

原创 torch.nn.Identity 占位符

增减网络时，使用它可以保证网络层数不变。

2023-08-07 15:30:46 276

原创 PyTorch中加载模型权重 A匹配B|A不匹配B

state_dict是包含参数和持久缓冲区的字典，可以看出 strict默认为True，所以默认状态下是严格要求state_dict中的key与torch.nn.Module.state_dict返回的key完全一致的。如果 strict 为 True，则 state_dict 的键必须与该模块的 state_dict() 函数返回的键完全匹配。1.将权重导入原模型，之后在加载后的原模型基础上进行修改。missing_keys 是包含缺失键的 str 列表。很简单，直接.load_state_dict()

2023-08-05 17:58:49 850

Java实现邻接表.html

空空如也