西交小铂牛-CSDN博客

原创 day12打卡

的思路为主，尝试检索资料、视频、文档，用尽可能简短但是清晰的语言看是否能说清楚这三种算法每种算法的实现逻辑，帮助更深入的理解。三种启发式算法的示例代码：遗传算法、粒子群算法、退火算法。学习优化算法的思路（避免浪费无效时间）

2025-05-01 23:59:50 228

原创 day11

对于信贷数据的其他模型，如LightGBM和KNN 尝试用下贝叶斯优化和网格搜索。贝叶斯优化（2种实现逻辑，以及如何避开必须用交叉验证的问题）随机搜索（简单介绍，非重点实战中很少用到，可以不了解）time库的计时模块，方便后人查看代码运行时长。

2025-04-30 23:57:45 254

模型: DecisionTreeClassifier。模型: RandomForestClassifier。尝试对心脏病数据集采用机器学习模型建模和评估。模型: LogisticRegression。F1 分数: 0.8923。F1 分数: 0.8333。F1 分数: 0.8438。准确率: 0.8852。精确率: 0.8788。召回率: 0.9062。准确率: 0.8361。精确率: 0.8929。召回率: 0.7812。准确率: 0.8361。精确率: 0.8438。召回率: 0.8438。

2025-04-29 23:46:24 429

原创 day9打卡

尝试对着心脏病数据集绘制热力图和单特征分布的大图（包含几个子图）enumerate（）函数。介绍了热力图的绘制方法。介绍了子图的绘制方法。

2025-04-28 19:27:49 756

原创 day8打卡

对心脏病数据集的特征用上述知识完成，一次性用所有的处理方式完成预处理，尝试手动完成，多敲几遍代码。连续特征的处理：归一化和标准化。至此，常见的预处理方式都说完了。

2025-04-27 19:03:25 388

原创 day7打卡

针对之前学到的所有知识，针对心脏病项目的数据集来完成数据的预处理。数据集中不存在缺失值。

2025-04-26 17:04:32 801

原创 day6打卡

特征与标签的关系图：对于数值型标签，散点图可以显示特征与标签之间是否存在线性或非线性关系；对于分类型标签，箱线图可以显示不同类别下特征的分布差异。结论：单特征分布图：可以观察特征的分布是否符合正态分布，是否存在偏态，是否有离群值等。针对其他特征绘制单特征图和特征和标签的关系图，观察有趣结论。

2025-04-25 21:39:11 145

原创 day5打卡

注意是py文件中，所以每一步的输出是否正确需要你来使用debugger功能来逐步查看。现在在py文件中一次性处理data数据中所有的连续变量和离散变量。3. 对独热编码后的变量转化为int类型。2. 对离散变量进行one-hot编码。1. 读取data数据。对所有缺失值进行填充。

2025-04-24 22:14:03 906

原创 day4打卡

按照示例代码的要求，去尝试补全信贷数据集中的数值型缺失值。打开数据（csv文件、excel文件）查看数据（尺寸信息、查看列名等方法）初识pandas库与缺失数据的补全。利用循环补全所有列的空值。众数、中位数填补空值。

2025-04-23 21:19:08 867

原创 day3打卡

创建一个包含三个字符串元素的列表 tech_list，元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素（索引为 1），将其从 “Java” 更改为 “Ruby”。定义一个包含整数的列表 scores，赋值为 [85, 92, 78, 65, 95, 88]。计算当前 tech_list 的长度，并将结果存储在变量 current_length 中。- 28-35度：打印"黄色预警：天气炎热"- 20-27度：打印"绿色提示：适宜温度"

2025-04-22 14:56:13 410

原创 day2打卡

题目: 定义两个整数变量，score_a 赋值为 75，score_b 赋值为 90。比较 score_a 是否大于 score_b，将比较结果（布尔值）存储在变量 is_a_higher 中；比较 score_a 是否小于等于 score_b，将结果存储在变量 is_a_lower_or_equal 中；比较 score_a 是否不等于 score_b，将结果存储在变量 is_different 中。题目: 定义两个字符串变量，str1 赋值为 “Hello”，str2 赋值为 “Python”。

2025-04-21 10:54:17 324

原创 day1 打卡

计算这两个变量的和，并将结果存储在一个新的变量 a 中；计算这两个变量的商，叫做b；计算这两个变量的余数，叫做c。然后，使用 f-string 打印出类似 “20 加 8 的结果是：28” 的信息，分成三行打印。计算折扣后的价格，并将结果存储在变量。心得：使用debug逐层调试代码，以基础看原理，明白.py文件运行方法。函数将每个变量的值单独打印出来，每个值占一行。如果想在输出的姓名两边加上引号，例如。存储你所在的城市（字符串，例如。关键在于双引号的使用，符号的定义。存储你的名字（字符串，例如。

2025-04-20 18:00:39 460

铂牛的博客