自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

原创 第四十二天打卡

hook函数的模块钩子和张量钩子。Grad-CAM的示例。理解下今天的代码即可。

2025-06-04 22:07:19 413

原创 第四十一天打卡

尝试手动修改下不同的调度器和CNN的结构,观察训练的差异。

2025-06-03 22:37:32 175

原创 第四十天打卡

仔细学习下测试和训练代码的逻辑,这是基础,这个代码框架后续会一直沿用,后续的重点慢慢就是转向模型定义阶段了。dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭dropout。展平操作:除第一个维度batchsize外全部展平。彩色和灰度图片测试和训练的规范写法:封装在函数中。

2025-06-02 22:14:13 224

原创 第三十八天打卡

batchisize和训练的关系。图像数据的格式:灰度和彩色数据。今日代码较少,理解内容即可。Dataloader类。

2025-06-01 21:18:21 154

原创 第三十七天打卡

保存全部信息checkpoint,还包含训练状态。过拟合的判断:测试集和训练集同步打印指标。

2025-05-31 22:13:12 289

原创 第四十六天打卡

对之前的信贷项目,利用神经网络训练下,尝试用到目前的知识点让代码更加规范和美观。:尝试进入nn.Module中,查看他的方法。探索性作业(随意完成)

2025-05-30 22:15:16 121

原创 第三十五天打卡

三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。进度条功能:手动和自动写法,让打印结果更加美观。作业:调整模型定义时的超参数,对比下效果。推理的写法:评估模式。

2025-05-29 21:03:59 163

原创 第三十四天打卡

类的call方法:为什么定义前向传播时可以直接写作self.fc1(x)ps:在训练过程中可以在命令行输入nvida-smi查看显存占用情况。GPU训练的方法:数据和模型移动到GPU device上。CPU性能的查看:看架构代际、核心数、线程数。GPU性能的查看:看显存、看级别、看架构代际。

2025-05-28 22:16:50 178

原创 第三十三天打卡

查看显卡信息的命令行命令(cmd中使用)数据预处理(归一化、转换成张量)PyTorch和cuda的安装。继承nn.Module类。定义损失函数和优化器。

2025-05-27 22:21:07 203

原创 第三十二天打卡

作业:参考pdpbox官方文档中的其他类,绘制相应的图,任选即可。

2025-05-26 22:30:53 388

原创 第三十一天打卡

尝试针对之前的心脏病项目ipynb,将他按照今天的示例项目整理成规范的形式,思考下哪些部分可以未来复用。│ └── processed/ # 处理后的数据。│ ├── config.py # 配置参数。│ └── utils.py # 工具函数。a) 数据预处理模块 (data_preprocessing.py)b) 通用模型模块 (model.py)"""构建可配置的分类模型""""""加载原始数据集""""""绘制ROC曲线"""

2025-05-25 19:02:29 674

原创 第三十天打卡

├── utils/└── lib/# main.pyimport syssys.path.append("./utils") # 将 utils 目录添加到搜索路径from math_tools import add # 导入自定义模块from .math_tools import add # 相对导入语法# 终端中设置环境变量(临时生效)# main.pyimport helper # 直接导入 lib/helper.py@浙大疏锦行。

2025-05-24 22:29:51 192

原创 第二十九天打卡

这段学习历程不仅是技术积累,更是从面向过程到面向对象思维的跨越,让我深刻理解Python作为AI首选语言的魅力——它用简洁语法承载复杂逻辑,为探索智能世界铺就坚实基石。复习类和函数的知识点,写下自己过去29天的学习心得,如对函数和类的理解,对python这门工具的理解等,未来再过几个专题部分我们即将开启深度学习部分。在过去的29天里,我系统性地梳理了Python函数与类的核心知识,并深刻体会到编程思维的转变过程。的动态参数机制,理解LEGB作用域规则后,闭包与装饰器的实践(如用。

2025-05-23 22:24:35 335

原创 第二十八天打卡

calculate_perimeter():计算周长(公式:2×(长+宽))。is_square() 方法,判断是否为正方形(长 == 宽)。calculate_circumference():计算圆的周长(公式:2πr)。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。shape_type="circle":创建圆(参数:半径)。calculate_area():计算面积(公式:长×宽)。

2025-05-22 20:19:21 216

原创 第二十七天打卡

编写一个装饰器 logger,在函数执行前后打印日志信息(如函数名、参数、返回值)

2025-05-21 21:36:49 167

原创 第二十六天打卡

编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。如果长度或宽度为负数,函数应该返回 0。的函数,该函数接收图形的名称。

2025-05-20 22:17:17 400

原创 第二十五天打卡

理解今日的内容即可,可以检查自己过去借助ai写的代码是否带有try-except机制,以后可以尝试采用这类写法增加代码健壮性。

2025-05-19 22:25:51 269

原创 第二十四天打卡

对自己电脑的不同文件夹利用今天学到的知识操作下,理解下os路径。

2025-05-18 22:10:50 201

原创 第二十三天打卡

整理下全部逻辑的先后顺序,看看能不能制作出适合所有机器学习的通用pipeline。ColumnTransformer和Pipeline类。构建完整pipeline。转化器和估计器的概念。pipeline代码。

2025-05-17 22:31:06 169

原创 第二十二天打卡

自行学习参考如何使用kaggle平台,写下使用注意点,并对下述比赛提交代码。

2025-05-16 22:32:26 206

原创 第二十一天打卡

自由作业:探索下什么时候用到降维?或者让ai给你出题,群里的同学互相学习下。可以考虑对比下在某些特定数据集上t-sne的可视化和pca可视化的区别。

2025-05-15 22:21:19 184

原创 第二十天打卡

尝试利用svd来处理心脏病预测,看下精度变化。训练集和测试集SVD降维。

2025-05-14 22:28:47 152

原创 第十九天打卡

对心脏病数据集完成特征筛选,对比精度。

2025-05-13 22:28:09 159

原创 第十七天打卡

参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。推断簇含义的2个思路:先选特征和后选特征。科研逻辑闭环:通过精度判断特征工程价值。通过可视化图形借助ai定义簇的含义。

2025-05-12 21:42:24 218

原创 第十七天打卡

对心脏病数据集进行聚类。

2025-05-11 20:39:01 193

原创 第十六天打卡

numpy数组的创建:简单创建、随机创建、遍历、运算。numpy数组的索引:一维、二维、三维。SHAP值的深入理解。

2025-05-10 22:24:24 173

原创 第十五天打卡

尝试找到一个kaggle或者其他地方的结构化数据集,用之前的内容完成一个全新的项目,这样你也是独立完成了一个专属于自己的项目。

2025-05-09 21:46:36 116

原创 第十四天打卡

尝试确定一下shap各个绘图函数对于每一个参数的尺寸要求,如shap.force_plot力图中的数据需要满足什么形状?确定分类问题和回归问题的数据如何才能满足尺寸,分类采取信贷数据集,回归采取单车数据集。参考文档补全剩余的几个图。

2025-05-08 22:10:25 204

原创 第十三天打卡

不平衡数据集的处理策略:过采样、修改权重、修改阈值。

2025-05-06 22:22:54 149

原创 第十二天打卡

今天以的思路为主,尝试检索资料、视频、文档,用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑,帮助更深入的理解。

2025-05-05 21:51:03 173

原创 第十一天打卡

print(f"训练与预测耗时: {end_time - start_time:.4f} 秒")rf_pred = rf_model.predict(X_test) # 在测试集上预测。print("--- 1. 默认参数随机森林 (训练集 -> 测试集) ---")rf_model.fit(X_train, y_train) # 在训练集上训练。print("\n默认随机森林 在测试集上的分类报告:")print("默认随机森林 在测试集上的混淆矩阵:")# --- 1. 默认参数的随机森林 ---

2025-05-04 22:23:32 321

原创 第十天打卡

【代码】第十天打卡。

2025-05-03 22:22:49 143

原创 第九天打卡

创建嵌套字典用于映射。# 使用映射字典进行转换。

2025-05-01 22:28:36 339

原创 第八天打卡

【代码】第八天打卡。

2025-04-30 22:17:02 117

原创 第七天打卡

【代码】第七天打卡。

2025-04-29 22:35:53 243

原创 第六天打卡

单特征可视化:连续变量箱线图(还说了核密度直方图)、离散特征直方图。箱线图美化--->直方图。特征和标签关系可视化。

2025-04-28 22:25:08 118

原创 第五天打卡

现在在py文件中 一次性处理data数据中所有的连续变量和离散变量。3. 对独热编码后的变量转化为int类型。2. 对离散变量进行one-hot编码。4.对所有缺失值进行填充。1. 读取data数据。

2025-04-26 22:03:01 209

原创 第四天打卡

按照示例代码的要求,去尝试补全信贷数据集中的数值型缺失值。打开数据(csv文件、excel文件)查看数据(尺寸信息、查看列名等方法)初识pandas库与缺失数据的补全。利用循环补全所有列的空值。众数、中位数填补空值。

2025-04-25 21:42:29 189

原创 第三天打卡

创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"

2025-04-24 22:42:57 412

原创 第二天打卡

题目: 定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。题目: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。

2025-04-23 19:55:05 238

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除