自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(45)
  • 收藏
  • 关注

原创 Day45 Grad-CAM 与 Hook 函数

3.hook 函数的模块钩子和张量钩子。4.Grad-CAM 的示例。2.lambda 函数。

2026-01-29 00:10:59 27

原创 Day44 简单CNN

【代码】Day44 简单CNN。

2026-01-28 00:05:43 172

原创 Day 43训练和测试的规范写法

@浙大疏锦行知识点回顾:

2026-01-27 00:12:20 26

原创 Day42 图像数据与显存

4.batchsize 和训练的关系。1.图像数据的格式:灰度和彩色数据。3.显存占用的 4 种地方。a. 模型参数+梯度参数。d. 神经元输出中间状态。c. 数据批量所占显存。

2026-01-24 00:15:43 46

原创 Day41 Dataset和Dataloader

作业:了解 CIFAR 数据集,获取数据集中的一张图片。

2026-01-23 01:38:13 32

原创 Day40 早停策略和模型权重的保存

作业:对信贷数据集进行训练后保持权重,后继续训练50次,采取早停策略。

2026-01-22 00:00:51 67

原创 Day 39 模型可视化与推理

1.三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。2.进度条功能:手动和自动写法,让打印结果更加美观。3.推理的写法:评估模式。

2026-01-19 22:25:11 27

原创 Day 38 GPU训练和call方法

作业:每次 GPU 等待 CPU 存数据的时间不固定,系统动态开销(如 CPU 负载、显存碎片)干扰明显,且深度学习框架会合并同步操作,使实际等待次数少于记录次数,总开销并非简单的次数 × 固定时间。4.类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)3.GPU训练的方法:数据和模型移动到GPUdevice上。1.CPU性能的查看:看架构代际、核心数、线程数。2.GPU性能的查看:看显存、看级别、看架构代际。

2026-01-18 23:04:26 56

原创 Day37 MLP神经网络的训练

2.查看显卡信息的命令行命令(cmd 中使用)a.数据预处理 (归一化、转换成张量)i.继承nn.Module类。1.PyTorch和cuda的安装。c.定义损失函数和优化器。e.可视化loss 过程。ii.定义前向传播流程。4.简单神经网络的流程。作业:能够手敲今日代码。3.cuda 的检查。

2026-01-17 20:35:43 42

原创 Day36 官方文档的阅读

@浙大疏锦行

2026-01-16 22:48:25 31

原创 Day 35 文件的规范拆分和写法

【代码】Day 35 文件的规范拆分和写法。

2026-01-16 00:45:03 39

原创 Day 34 模块和库的导入

3.导入的核心逻辑:找到根目录。2.导入自定义库/模块的方式。1.导入官方库的三种手段。

2026-01-14 23:49:30 48

原创 Day33 复习日

2.装饰器思想的进一步理解。

2026-01-11 19:55:07 213

原创 Day32 类的定义和方法

题目 2: 定义长方形 (Rectangle) 类。题目 1: 定义圆 (Circle) 类。题目 3: 图形工厂。

2026-01-10 22:39:21 162

原创 Day31 函数专题2

作业:编写一个装饰器logger,在函数执行前后打印日志信息。

2026-01-09 23:45:32 209

原创 Day30 函数专题1

【代码】Day30 函数专题1。

2026-01-08 20:05:56 617

原创 Day 29 异常处理

4.try-except-else-finally机制。2.debug过程中的各类报错。3.try-except机制。

2026-01-07 22:45:13 192

原创 Day28 元组和OS模块

【代码】Day28 元组和OS模块。

2026-01-05 15:37:33 174

原创 Day27 机器学习流水线

作业:尝试制作出机器学习通用的pipeline。

2026-01-04 23:10:18 162

原创 Day26 复习日

仅可使用官方提供的数据集,在平台内完成数据预处理且不得修改数据集结构,提交文件需为仅含指定列的 CSV 格式,遵守每日提交次数限制;代码需使用平台支持的库、包含完整可复现流程且为原创,禁止抄袭或依赖外部缓存、已训练模型权重,个人参赛不可与他人协作共享代码或结果,同时需确保提交文件大小符合限制,模型训练目标需与竞赛评估指标一致。

2026-01-03 23:59:15 144

原创 Day 25 常见的降维算法

特征降维:主成分分析:t-SNE:线性判别与分析:个人认为。

2026-01-02 23:58:00 119

原创 Day 24 奇异值分解

从结果来看,本次基于心脏病数据集的 SVD 降维与模型训练效果表现优异:先是将 13 维的原始医学特征压缩至 7 维,在实现约 46% 维度压缩的同时保留了 73.53% 的核心数据信息,对应的重构相对误差(约 51.45%)处于合理范围,降维兼顾了效率与信息完整性;而基于降维特征训练的逻辑回归模型,在测试集上达到了 88.52% 的准确率,这一成绩在心脏病预测任务中属于优秀水平,说明降维后的特征仍有效保留了区分健康 / 患病状态的关键信息,整体实现了 “维度简化” 与 “模型性能” 的良好平衡。

2025-12-29 23:27:09 249

原创 Day 23 常见的特征筛选算法

作业:对心脏病数据进行特征筛选,对比精度。

2025-12-25 17:46:38 184

原创 Day22 推断聚类后簇的类型

三个簇的划分,本质是基于 “年龄 + 胸痛类型 + 心血管风险指标” 的组合差异,对应了心脏病风险从低到高的三类群体。定义:处于中年向老年过渡阶段,无典型胸痛症状,血压、胆固醇等风险指标处于中间区间,心脏病风险介于簇 0 与簇 1 之间。定义:以中年群体为主,胸痛表现不固定,但血压、胆固醇等心血管风险指标均处于较低区间,是心脏病风险相对偏低的群体。定义:以老年群体为主,伴随典型心绞痛症状,同时血压、胆固醇等风险指标偏高,是心脏病风险相对较高的群体。胸痛类型几乎全为 0 类(典型心绞痛,心脏病典型症状);

2025-12-24 14:26:43 251

原创 Day 21 常见聚类算法

层次聚类树状图直观呈现了心脏病数据集样本的簇合并过程,纵坐标代表簇间合并差异度(值越小表明簇间相似度越高),横坐标对应不同阶段的簇分组;底部小簇因相似度高优先合并,随纵坐标升高逐步形成中簇、大簇,合并差异度持续增大,而顶部最大差异处的切分结果与此前选定的 n=2 聚类数一致,进一步验证了该聚类数在心脏病数据无监督分组中的合理性。结果还是很差,可能与eps小有关,我调整成1.2/1.5都试了试,效果也不显著,结果差不多。2.聚类常见算法:kmeans聚类、dbscan聚类、层次聚类。二.dbscan聚类。

2025-12-23 17:04:57 342

原创 Day20 深入理解SHAP图

收入的影响方向最稳定(收入越高房价越高);而 “卧室数、人口数量” 等特征对房价几乎无影响,建模时可考虑剔除。影响加州房价的核心因素是地理区位(纬度 + 经度)和居民收入,其中。

2025-12-22 23:40:51 354

原创 Day19 Python Study

【代码】Day19 Python Study。

2025-12-21 23:34:41 217

原创 Day 18 回归问题与置信区间

【代码】Day 18 回归问题与置信区间。

2025-12-20 15:30:00 214

原创 Day 17 多分类问题

【代码】Day 17 多分类问题。

2025-12-19 16:34:03 289

原创 Day16 ROC曲线和PR曲线

【代码】 Day16 ROC曲线和PR曲线。

2025-12-18 22:54:25 150

原创 Day15 不平衡数据集的处理

一、数据准备与基线模型。二、数据层面处理方法。

2025-12-16 22:54:18 233

原创 Day 14 多目标优化算法

通过多目标优化,我们不再是得到一个单一的“最佳”模型,而是得到了一系列“各有所长”的优秀模型,这为实际应用提供了更大的灵活性。

2025-12-15 22:49:19 240

原创 Day13 启发式算法

重点学习了遗传算法GA、粒子群优化PSO、 模拟退火SA。

2025-12-14 23:14:20 301

原创 Day12 贝叶斯优化可视化和随机森林的解读

1. 有序:可以通过索引取出来元素。二、字典的items方法。2. 不可变,不可修改。3. 可迭代、可切片。三、贝叶斯优化可视化。

2025-12-13 23:52:01 250

原创 Day 11 常见的调参方式

学习目标三种主流调参方法:网格搜索(GridSearchCV):穷举式搜索穷举所有参数组合、能找到最优解、计算量大,维度灾难、 参数空间小,计算资源充足随机搜索(RandomizedSearchCV):随机采样---只是一种思想随机采样参数组合、效率高于网格搜索 、可能错过最优解、参数空间大,中等计算资源贝叶斯优化(BayesSearchCV):智能优化基于概率模型智能搜索、高效,收敛快 、实现复杂 、 参数空间大,计算资源有限。

2025-12-12 23:55:30 348

原创 Day 10 机器学习建模与评估

尝试对心脏病数据集采用机器学习模型建模和评估。

2025-12-11 23:10:42 157

原创 Day 9 热力图、子图的绘制

1.相关系数热力图热力图(Heatmap)是一种通过颜色深浅来展示数据矩阵的可视化方法。在数据分析中,我们常用热力图来展示特征之间的相关系数矩阵。常用配色方案:coolwarm: 冷暖色调,适合展示正负相关(蓝色表示负相关,红色表示正相关)RdYlGn: 红黄绿配色,直观展示好坏程度viridis: 色盲友好,从紫色到黄色的渐变plasma: 鲜艳的紫红黄配色YlOrRd: 从黄色到橙色到红色,适合展示强度2.子图。

2025-12-10 22:44:16 350

原创 Day8 机器学习数据预处理

对心脏病数据集的特征用上述知识完成,一次性用所有的处理方式完成预处理,包括缺失值的处理、离散特征的编码、连续特征的归一化or标准化、数据可视化。

2025-12-08 22:42:00 178

原创 Day 7 复习日+查看函数参数

针对心脏病项目的数据集来完成数据的预处理。

2025-12-07 23:33:40 175

原创 Day5 离散特征的处理(独热编码)

现在在py文件中 一次性处理data数据中所有的连续变量和离散变量,注意是py文件中,所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。4. 对独热编码后的变量转化为int类型。3. 对离散变量进行one-hot编码。按照示例代码过一遍,完成下列题目。2.填补缺失值(离散+连续)1.读取data数据。

2025-12-06 23:43:23 214

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除