Nina_717-CSDN博客

原创 pytorch核心组件以及流程

分析表明，PyTorch的架构设计是一条清晰的路径：从具体的torch.Tensor（数据基础）到抽象的torch.nn.Module（模型构建），所有这一切都由一个强大且灵活的torch.autograd（动态引擎）驱动，并通过torch.utils.data（数据管道）获取燃料。PyTorch的命令式特性（也称为“Eager Mode”或“Define-by-Run”）允许图在运行时动态构建 2，这使其在研究中（需要处理复杂的、动态变化的模型）具有无与伦比的优势 3。然而，这种灵活性是有代价的。

2025-11-12 15:29:42 770 1

原创 langgragh的思想与入门（二）

定义工具：使用 Python 函数并辅以 @tool 装饰器来定义智能体可用的工具，例如 add 和 multiply。绑定模型：初始化一个支持工具调用的 LLM（例如 Claude Sonnet 4.5 或 OpenAI Gpt-4o），并将工具列表绑定（.bind_tools(tools)）到模型上。这是关键一步。如前所述，状态需要使用 TypedDict 定义。# 应用核心重点：使用 Annotated 和 operator.add。

2025-11-11 20:00:41 1021

原创 langgragh的思想与入门（一）

例如，一个智能体在调用工具后，可能需要根据工具的输出“反思”，然后决定重新调用另一个工具，或者返回到上一个思考步骤来修正其计划。工作原理：当一个节点（Node）完成计算的时候，它会发送一条消息（即状态更新）到图中的一个或者多个其他节点。LangGraph 的架构灵感来源于 Google 的 Pregel 系统，其核心是基于消息传递的图计算。这是初学者最容易犯错，也是最关键的知识点。这是构建真正“智能”的、具备 ReAct 风格（Reasoning and Acting）的智能体所必需的基础。

2025-11-11 19:25:04 958

原创 Google提示词白皮书总结（2）

LLM在各种NLP中取得了令人瞩目的成果，但是他们的推理能力被视为一个仅靠增加模型大小无法解决的问题，通过之前文章的COT技术可以提示模型生成像人类解决问题一样的推理步骤。推理与行动提示是一种范式，使LLM能够通过自然语言与外部工具结合来解决复杂任务，执行某种操作，这是卖相agent的第一步，ReAct 从根本上扩展了LLM 的能力，允许它们与外部世界（或特定工具）交互以收集信息或执行仅靠文本生成无法完成的操作。这种方法¹⁵ 不仅减轻了人工输入的需要，而且还提高了模型在各种任务中的性能 1。

2025-10-16 20:29:11 627

原创 Google提示词白皮书总结（1）

本文总结了Google提示词白皮书的核心内容，聚焦于LLM输出配置和提示技巧两大方面。在输出配置部分，关键参数包括输出长度控制和采样设置（温度、Top-K、Top-P），这些参数直接影响生成结果的确定性、创造性和能耗。提示技巧主要分为三类：样本示例类（零样本、单样本/少样本）、系统/上下文/角色提示（用于设定任务框架和细化响应），以及回退提示（通过普遍化问题激活相关知识）。这些技巧可单独或组合使用，帮助优化LLM的输出质量和任务适配性。

2025-10-16 18:56:31 818

原创第二章 prompt思维链

将思维链提示过程进一步发展，首先将问题分解为子问题，然后逐个解决。你可以通过分解问题、推理假设、分析因素、总结归纳等方式，逐步帮助自己或他人理清复杂问题的思路。2.主要思想：通过向大语言模型展示一些少量的ex，在ex中解释推理过程，大模型在回答提示时也会显示推理过程。1.思维链CoT提示过程是一种最近开发的提示方法，鼓励大语言模型解释推理过程，对算术一些任务有所改进。3.引导假设以及推理：如果，那么，基于此，我们可以得出。1.明确问题与目标：问题是。2.分解步骤，逐层推进：首先，接下来，然后。

2025-10-04 18:55:37 475

原创第一章——了解prompt以及一些基础技巧方法

Prompt的定义——用户向LLM输入的一段文本，用于指导LLM生成符合用户要求的输出。Prompt的本质——沟通的桥梁，决定LLM准确预测用户意图的能力。

2025-10-04 17:55:54 922

原创 AI论文阅读方法+arixiv

文件拖拽到AI，发送提示词：“请仔细阅读这篇论文，提取出其核心内容，包括研究目的、主要方法、关键结论和创新点。用简洁明了的语言总结出论文的核心概述，字数控制在300字以内。重点突出论文的研究重点和贡献，避免过多细节描述，确保内容精炼且准确反映论文主旨。在完成前面各部分的基础上，对整篇论文进行总结。总结内容包括论文的主要贡献、研究方法的创新点、实验结果的意义以及论文的不足之处和未来可能的研究方向。

2025-07-28 16:06:13 777

原创 Day 52 训练

在深度学习的实践中，超参数的调整往往决定了模型的最终性能。然而，与传统机器学习不同，深度学习模型的训练过程复杂且耗时，这使得我们无法像处理传统模型那样随意使用网格搜索、贝叶斯优化等方法。今天，我们就来深入探讨神经网络调参的实战指南，帮助你在有限的资源和时间内，高效地优化模型性能。在深度学习的探索之旅中，随着学习的深入，有些基础概念就像绕不开的十字路口，我们必须扎实掌握它们。这种情况下，反向传播时的梯度也完全相同，神经元无法学习到不同的特征，模型将失去表达能力。

2025-06-20 17:35:37 840

原创 Day 50 训练

通过在 ResNet18 中插入 CBAM 模块，并采用先冻结预训练层再训练其他层的策略，我们成功地优化了预训练模型的性能。实验表明，这种优化方式在 CIFAR-10 数据集上取得了较好的效果。在今后的研究中，我们还可以尝试在其他预训练模型中插入不同的注意力模块，并探索更多有效的预训练策略，以进一步提升模型的性能。以上内容仅供参考，你可以根据实际需求进行调整和补充，希望对你有所帮助！@浙大疏锦行。

2025-06-17 15:39:57 918

原创 Day 49 训练

今天我们就来深入探索CBAM（Convolutional Block Attention Module）注意力模块，它就像给卷积神经网络（CNN）装上了"智能眼镜"，能让模型同时学会"关注什么"和"关注哪里"。它的核心目标是通过学习的方式，自动获取特征图在通道和空间维度上的重要性，进而对特征图进行自适应调整——增强重要特征，抑制不重要特征，从而提升模型的特征表达能力和性能。通道注意力模块的作用是分析"哪些通道的特征更关键"。空间注意力模块的作用是定位"关键特征在图像中的具体位置"，例如物体所在区域。

2025-06-14 23:13:04 1122

原创 Day 48

A.shape[-1] == B.shape[-2]，即 A 的列数等于 B 的行数。

2025-06-13 17:03:17 686

原创 Day 47 训练

在这里，我们用它来捕获目标卷积层（model.conv3）输出的特征图（activation_maps）。更高级的技术，如类激活映射（CAM）、梯度加权类激活映射（Grad-CAM）及其变种（Grad-CAM++, Score-CAM等），通过结合梯度信息来计算特征图的权重，通常能提供更精确、更与类别相关的注意力可视化。前向传播：执行outputs = model(images)，这会正常计算模型的输出，并在经过model.conv3时触发我们注册的钩子，从而将特征图存入activation_maps。

2025-06-12 16:09:47 858

原创 DAY 46训练

在深度学习领域，注意力机制已成为一种关键的技术。它赋予模型“选择性关注重要信息”的能力，就像人类视觉会自动聚焦于图片主体而忽略背景。本文将深入探讨注意力机制的原理、特征图可视化以及通道注意力的实现与效果。深度学习的发展历程中，特征提取方法经历了从 onehot、elmo 到 self-attention 及 encoder-bert 等不同阶段。这些方法各有特点，从弱到强逐步发展。Transformer 中的自注意力机制是一种“自己学习自己”的方式，能自动聚焦于关键信息而忽略背景。数学上，它对输入特征进行加

2025-06-12 00:37:10 754

原创 DAY45 训练

在神经网络训练过程中，各种辅助组件如训练进度条、可视化 loss 曲线、权重分布图等能极大提升我们的理解与训练效果。而 TensorBoard 这一可视化工具，能够轻松整合这些功能，实现训练过程的实时监控与动态调整，下面将详细介绍其相关操作。TensorBoard 的核心在于将训练数据先记录到日志文件，再通过网页展示。安装命令为，但刚才尝试解析该链接时因网络问题未能成功，可能是链接合法性或网络状况导致，可检查链接后重试，若无需解析此链接，可继续阅读后续内容。以下是 TensorBoard 核心代码解析（无需

2025-06-10 19:41:23 915

原创 DAY 44 训练

从 1998 年 Yann LeCun 等人提出的 LeNet-5 验证 CNN 可行性，到 2012 年 AlexNet 引发深度学习复兴，再到 2015 年 ResNet 解决超深网络训练难题，预训练模型不断发展。后续模型如 DenseNet、MobileNet、EfficientNet 等在特征复用、计算效率、自动化设计等方面持续优化。LeNet-5：首个 CNN 架构，包含卷积层、池化层、全连接层，采用 Sigmoid 激活函数，主要用于手写数字识别（MNIST）。AlexNet。

2025-06-09 22:53:34 946

原创 DAY 43 训练

在当今数字化时代，图像分类任务作为计算机视觉领域的重要基石，正推动着诸多行业的智能化转型。本文将带您深入探索如何利用 PyTorch 框架高效实现猫狗二分类模型的构建与训练，并借助 Grad-CAM 技术直观可视化模型决策依据，助力您快速踏入深度学习实践领域。训练集经随机裁剪与水平翻转增强数据多样性，转化为张量后标准化；优质的数据预处理是模型成功的关键起点。精心反归一化还原图像，叠加热力图直观呈现关键区域，助力理解模型决策逻辑。多轮迭代训练，动态监测损失与准确率，逐步优化模型性能。

2025-06-08 17:22:41 489

原创 Day42 训练

摘要：Grad-CAM技术通过PyTorch的hook机制打开深度学习模型"黑盒"，可视化CNN决策过程。该方法利用反向传播梯度信息生成类激活映射，直观显示图像关键区域。实现过程包括：1) 定义模块/张量hook监听中间层数据；2) 计算特征图梯度权重；3) 生成热力图并叠加原图。该技术可应用于模型调试、决策解释和数据评估，在医疗影像等高价值领域尤为重要。研究表明，Grad-CAM结合hook函数能有效提升模型可解释性，为深度学习研究提供关键分析工具。（150字）

2025-06-07 16:59:01 696

原创 Day 41 训练

Python复制#====================== 2. CNN模型定义 ======================# 第一个卷积块# 第二个卷积块# 第三个卷积块# 全连接层# 保存特征图用于可视化# 第一个卷积块# 第二个卷积块# 第三个卷积块# 全连接层我定义了一个简单的 CNN 模型SimpleNet，它包含三个卷积块，每个卷积块后都跟着 Batch Normalization 层、ReLU 激活函数和最大池化层。最后是全连接层用于分类。

2025-06-06 18:53:50 360

原创 Day 40训练

self.flatten = nn.Flatten() # 将 28x28 图像展平为 784 维向量return x数据处理规范化：利用DataLoader和Dataset对数据进行分批次处理，提高数据加载效率。模型结构清晰化：明确展平操作在图像任务中的应用，彩色图像需考虑通道维度。训练测试函数封装：将训练和测试逻辑封装为函数，便于参数调整与复用，为多模型对比奠定基础。迭代损失记录：记录每个迭代的损失，绘制损失曲线辅助训练过程分析。

2025-06-05 19:50:59 982

原创 Day39 训练

图像数据处理是深度学习的一个重要分支，从理解数据结构到构建神经网络模型，再到优化显存管理，每一步都充满了技巧和智慧。希望这篇博客能为大家在图像处理的道路上提供帮助，让大家的模型在显存的舞台上绽放光彩。未来，我们将继续探索更高效的模型结构和优化策略，共同揭开深度学习的更多奥秘。@浙大疏锦行。

2025-06-04 17:23:19 753

原创 Day38 训练

Dataset类是PyTorch中所有数据集的基类。数据存储路径/来源：如文件路径、数据库查询等原始数据的读取方式：如图像解码为PIL对象、文本读取为字符串等样本的预处理逻辑：如裁剪、翻转、归一化等，通常通过transform参数实现返回值格式：如Dataset__len__()：返回数据集的样本总数：根据索引返回对应样本的数据和标签DataLoader类负责将数据集切分为多个批次（batch），并支持多线程加载数据。批量大小（batch_size）

2025-06-03 15:52:57 538

原创 Day 37 训练

通过本文的实例，我们详细介绍了如何在 PyTorch 中进行模型训练、保存与加载，以及如何应用早停法来防止过拟合。这些技术在实际的深度学习项目中具有广泛的应用价值。掌握这些技能，将有助于您更好地构建和优化深度学习模型。浙大疏锦行。

2025-06-02 17:30:10 712

原创 Day 36训练

本项目的目标是利用给定的数据集，训练一个神经网络模型，以预测个人是否会发生信用违约。数据集包含多种特征，如年度收入、信用评分、当前贷款金额等，以及目标变量“Credit Default”（信用违约）。我选择了二元交叉熵损失函数（BCEWithLogitsLoss）和Adam优化器。

2025-06-01 17:57:21 509

原创 Day 35 训练

self.fc1 = nn.Linear(4, 10) # 输入层到隐藏层self.fc2 = nn.Linear(10, 3) # 隐藏层到输出层return out# 实例化模型并移至GPU定义了一个简单的多层感知机（MLP）模型，包含一个输入层、一个隐藏层和一个输出层。输入层接收 4 个特征维度的数据，隐藏层有 10 个神经元并使用 ReLU 激活函数，输出层有 3 个神经元，用于对应鸢尾花的 3 个类别。通过将模型放置在指定设备上。

2025-06-01 00:27:35 708

原创 Day 34 训练

定义__call__是 Python 中的一个特殊魔术方法，当一个类的实例被像函数一样调用时，会触发该方法。它允许类的实例表现得像函数一样，同时还能保留对象的内部状态。示例不带参数的__call__方法：定义了一个Counter类，在其__call__方法中，每次调用实例时，内部的count属性会加 1 并返回当前值。通过counter()的方式调用实例，可以实现计数功能，且每次调用都会更新内部状态。带参数的__call__方法：定义了一个Adder类，在其__call__方法中，接受两个参数a和b。

2025-05-30 22:24:27 890

空空如也

购买课程下架，怎么都看不了