朝朝辞暮i-CSDN博客

原创机器学习与深度学习day16——numpy数组与shap的深度理解(day15复习日)

NumPy 数组的或称为的概念，与我们日常理解的维度非常相似。[][][][]

2025-11-30 19:03:29 725

理解复杂机器学习模型（尤其是“黑箱”模型，如随机森林、梯度提升树、神经网络等）为什么会对特定输入做出特定预测。SHAP 提供了一种统一的方法来解释模型的输出。核心思想：合作博弈论中的 Shapley 值SHAP (SHapley Additive exPlanations) 的核心基于博弈论中的Shapley 值概念。模型的特征 (Features)就是玩家。目标是预测某个样本的输出值。不同的特征子集可以“合作”起来进行预测。某个特征子集进行预测得到的值。如何公平地。

2025-11-26 21:48:26 715

原创机器学习与深度学习day13——不平衡数据集的处理策略

特性修改类别权重 (修改分类阈值作用阶段模型训练时模型预测（或评估）时作用对象模型的损失函数参数学习过程模型输出概率/分数到最终预测的决策规则对模型影响改变学习到的模型本身和决策边界不改变已学习到的模型性质根本性调整，代价敏感学习后处理性质的调整目标侧重学习一个内在区分能力更强的模型在现有模型上调整性能指标的权衡实现方式设置算法的参数（如在预测后应用不同的概率门槛。

2025-11-25 14:15:26 1221

原创机器学习与深度学习day12——启发式算法

-- 1. 默认参数随机森林 (训练集 -> 测试集) ---训练与预测耗时: 0.9480 秒默认随机森林在测试集上的分类报告：默认随机森林在测试集上的混淆矩阵：今天介绍下遗传算法，在你以后的论文写作中可以水一节，胆子大的人才可以水一章这些算法仅作为你的了解，不需要开始学习，如果以后需要在论文中用到，在针对性的了解下处理逻辑。下面介绍这几种常见的优化算法。

2025-11-23 10:00:00 1657

原创从0开始学python（day27——用python操作pdf文件）

在学习完上面的内容之后，相信大家已经知道像合并多个PDF文件这样的工作应该如何用Python代码来处理了，赶紧自己动手试一试吧。

2025-11-22 10:00:00 787

原创机器学习与深度学习day11番外篇——数据结构{元组、字典方法}与贝叶斯可视化——可放在复习日day15看

items() 方法是 Python 中字典 (Dictionary) 对象的一个非常常用的方法。在python历史中，字典是无序的，Python 3.7 及更高版本，字典正式成为有序的。字典的items方法，这个方法很重要，在后面深度学习的代码中自由度很高，我们会频繁接触到这个方法，我们来介绍下。聪明的你肯定注意到了，这和我们前几天说的enumerate方法非常像，他可以遍历任何可迭代对象，返回索引+元素。大家记住这个写法，我们未来会有针对解包的专题，解包是非常非常重要的知识点.

2025-11-22 10:00:00 1236

原创从0开始学python（day26——用python操作word与powerpoint，可跳过）

用Python程序解决办公自动化的问题真的非常酷，它可以将我们从繁琐乏味的劳动中解放出来。写这类代码就是去做一件一劳永逸的事情，写代码的过程即便不怎么愉快，使用这些代码的时候应该是非常开心的。建议大家用ai试一试，让你的工作能够更轻松。

2025-11-21 10:00:00 830

原创机器学习与深度学习day11——常见调参方法

模型组成= 算法 + 实例化设置的外参（超参数）+ 训练得到的内参调参原则：只要调参就需要考2次传统方式：划分训练集、验证集、测试集现代方式：很多调参函数自带交叉验证（可省去验证集）方法原理优点缺点适用场景网格搜索穷举所有参数组合能找到最优解计算量大，维度灾难参数空间小，计算资源充足随机搜索随机采样参数组合效率高于网格搜索可能错过最优解参数空间大，中等计算资源贝叶斯优化基于概率模型智能搜索高效，收敛快实现复杂参数空间大，计算资源有限方法准确率精确率(类1)

2025-11-21 10:00:00 1515

原创从0开始学python（day25——用python读写excel-2）

Excel是Microsoft（微软）为使用Windows和macOS操作系统开发的一款电子表格软件。Excel凭借其直观的界面、出色的计算功能和图表工具，再加上成功的市场营销，一直以来都是最为流行的个人计算机数据处理软件。当然，Excel也有很多竞品，例如Google Sheets、LibreOffice Calc、Numbers等，这些竞品基本上也能够兼容Excel，至少能够读写较新版本的Excel文件，当然这些不是我们讨论的重点。

2025-11-20 10:00:00 602

原创机器学习与深度学习day10——机器学习建模与评估

之前光看纸质内容，很难理解标签和特征的意思，也不懂为什么要划分测试集和训练集，划分的意义是什么，到底怎么训练的。原来机器学习与深度学习更像是一个实践课程，和做很多事情一样，干中学更好理解和使用。

2025-11-20 10:00:00 1469

原创从0开始学python（day24——用python读写excel文件-1）

Excel是Microsoft（微软）为使用Windows和macOS操作系统开发的一款电子表格软件。Excel凭借其直观的界面、出色的计算功能和图表工具，再加上成功的市场营销，一直以来都是最为流行的个人计算机数据处理软件。当然，Excel也有很多竞品，例如Google Sheets、LibreOffice Calc、Numbers等，这些竞品基本上也能够兼容Excel，至少能够读写较新版本的Excel文件，当然这些不是我们讨论的重点。

2025-11-19 10:00:00 683

原创机器学习与深度学习day9——热力图与子图绘制

热力图(Heatmap)是一种通过颜色深浅来展示数据矩阵的可视化方法。在数据分析中,我们常用热力图来展示特征之间的相关系数矩阵。相关系数的含义:- 取值范围: [-1, 1]- 接近1: 强正相关(一个增加,另一个也增加)- 接近-1: 强负相关(一个增加,另一个减少)- 接近0: 无线性相关关系注意事项:- 热力图适合展示连续变量之间的关系- 对于离散变量,相关系数的意义需要谨慎解读- 本例中为了演示方便,对所有数值型特征都进行了计算# 基础热力图 - 使用coolwarm配色。

2025-11-19 10:00:00 968

原创从0开始学python（day23——读写CSV文件）

CSV（Comma Separated Values）全称逗号分隔值文件是一种简单、通用的文件格式，被广泛的应用于应用程序（数据库、电子表格等）数据的导入和导出以及异构系统之间的数据交换。因为CSV是纯文本文件，不管是什么操作系统和编程语言都是可以处理纯文本的，而且很多编程语言中都提供了对读写CSV文件的支持，因此CSV格式在数据处理和数据科学中被广泛应用。纯文本，使用某种字符集（如ASCIIUnicodeGB2312）等）；由一条条的记录组成（典型的是每行一条记录）；

2025-11-18 10:00:00 553

原创机器学习与深度学习day8——标签编码与连续变量处理

目前我们只会用到映射这个用法,他需要传入的是字典,因为字典的键值对,键是唯一的,值可以重复。这很符合数据的特征是固定的,但是值可以变化这个特性。所以后续想完成新的映射,直接修改字典的键值对即可。: 字典是Python中非常重要的数据结构,在数据处理中经常用于映射和转换。'Alice'好的进入正题。

2025-11-18 10:00:00 1380

原创从0开始学python（day22——对象的序列化和反序列化）

Python中实现序列化和反序列化除了使用json模块之外，还可以使用pickle和shelve模块，但是这两个模块是使用特有的序列化协议来序列化数据，因此序列化后的数据只能被Python识别，关于这两个模块的相关知识，有兴趣的读者可以自己查找网络上的资料。处理JSON格式的数据很显然是程序员必须掌握的一项技能，因为不管是访问网络API接口还是提供网络API接口给他人使用，都需要具备处理JSON格式数据的相关知识。

2025-11-17 10:00:00 822

原创机器学习与深度学习day7——复习日（查看函数参数）

本教程介绍在 VSCode 中查看 Python 函数参数的多种方法。

2025-11-17 10:00:00 1506

原创从0开始学python（day21——文件读写与异常处理）

通过读写文件的操作，我们可以实现数据持久化。在Python中可以通过open函数来获得文件对象，可以通过文件对象的read和write方法实现文件读写操作。程序在运行时可能遭遇无法预料的异常状况，可以使用Python的异常机制来处理这些状况。Python的异常机制主要包括tryexceptelsefinally和raise这五个核心关键字。try后面的except语句不是必须的，finally语句也不是必须的，但是二者必须要有一个；except语句可以有一个或多个，多个except。

2025-11-16 10:00:00 1005

原创机器学习与深度学习day6——数据可视化

day5主要针对离散特征做编码，day6针对连续特征做可视化之前已经说过，对于数据可视化一般会进行如下操作。

2025-11-16 10:00:00 2169 2

原创机器学习与深度学习day5——离散特征处理（独热编码）

3. 对独热编码后的变量转化为int类型。2. 对离散变量进行one-hot编码。4. 对所有缺失值进行填充。1. 读取data数据。

2025-11-15 10:00:00 566

原创从0开始学python（day20——初识python库）

哈希函数又称哈希算法或散列函数，是一种为已有的数据创建“数字指纹”（哈希摘要）的方法。哈希函数把数据压缩成摘要，对于相同的输入，哈希函数可以生成相同的摘要（数字指纹），需要注意的是这个过程并不可逆（不能通过摘要计算出输入的内容）。举一个简单的例子，用户注册时我们希望在数据库中保存用户的密码，很显然我们不能将用户密码直接保存在数据库中，这样可能会导致用户隐私的泄露，所以在数据库中保存用户密码时，通常都会将密码的“指纹”保存起来，用户登录时通过哈希函数计算密码的“指纹”再进行匹配来判断用户登录是否成功。

2025-11-15 10:00:00 638

原创机器学习与深度学习day4——认识pandas

按照示例代码的要求，去尝试补全信贷数据集中的数值型缺失值。打开数据（csv文件、excel文件）查看数据（尺寸信息、查看列名等方法）初识pandas库与缺失数据的补全。利用循环补全所有列的空值。众数、中位数填补空值。

2025-11-14 10:00:00 346

原创从0开始学python（day19——面向对象编程实战）

面向对象的编程思想非常的好，也符合人类的正常思维习惯，但是要想灵活运用面向对象编程中的抽象、封装、继承、多态需要长时间的积累和沉淀，这件事情无法一蹴而就，属于“路漫漫其修远兮，吾将上下而求索”的东西。简化版本# 1. 定义花色（就像给颜色起名字）SPADE = 0 # 黑桃HEART = 1 # 红心CLUB = 2 # 梅花DIAMOND = 3 # 方块# 2. 定义单张牌self.suite = suite # 花色属性self.face = face # 点数属性。

2025-11-14 10:00:00 873

原创机器学习与深度学习day3——列表、循环和判断语句

创建一个包含三个字符串元素的列表 tech_list，元素分别为 “Python”, “Java”, “Go”。修改 tech_list 中的第二个元素（索引为 1），将其从 “Java” 更改为 “Ruby”。计算当前 tech_list 的长度，并将结果存储在变量 current_length 中。获取列表中的第一个元素，并将其存储在变量 first_tech 中。- 28-35度：打印"黄色预警：天气炎热"- 20-27度：打印"绿色提示：适宜温度"- 低于20度：打印"蓝色预警：注意保暖"

2025-11-13 10:00:00 845

原创从0开始学python（day18——面向对象编程进阶）

Python是动态语言，Python中的对象可以动态的添加属性。在面向对象的世界中，一切皆为对象，我们定义的类也是对象，所以类也可以接收消息，对应的方法是类方法或静态方法。通过继承，我们可以从已有的类创建新类，实现对已有类代码的复用。私有属性：加__前缀，不让随便访问属性装饰器：用@property让方法像属性一样用动态属性：Python可以运行时添加属性，__slots__可以限制静态方法，跟对象无关的工具函数类方法，操作类本身的方法继承：子类获得父类所有能力，还可以添加新能力多态。

2025-11-13 10:00:00 941

原创机器学习与深度学习day2——字符串操作与比较运算

题目: 定义两个整数变量，score_a 赋值为 75，score_b 赋值为 90。比较 score_a 是否大于 score_b，将比较结果（布尔值）存储在变量 is_a_higher 中；比较 score_a 是否小于等于 score_b，将结果存储在变量 is_a_lower_or_equal 中；比较 score_a 是否不等于 score_b，将结果存储在变量 is_different 中。题目: 定义两个字符串变量，str1 赋值为 “Hello”，str2 赋值为 “Python”。

2025-11-12 10:00:00 255

原创从0开始学python（day17——上强度：面向对象编程入门）

在Python中，可以使用class关键字加上类名来定义类，通过缩进我们可以确定类的代码块，就如同定义函数那样。在类的代码块中，我们需要写一些函数，我们说过类是一个抽象概念，那么这些函数就是我们对一类对象共同的动态特征的提取。写在类里面的函数我们通常称之为方法，方法就是对象的行为，也就是对象可以接收的消息。方法的第一个参数通常都是self，它代表了接收这个消息的对象本身print(f'学生正在学习{course_name}.')print(f'学生正在玩游戏.')# 定义数字时钟类"""数字时钟"""

2025-11-12 10:00:00 1216

原创机器学习与深度学习day1

实际上a,b,c=1,2,3这个神奇的表达是我们python一个很难的知识点，叫做解包。对这些经典的表达记住，未来会有更深入的理解。你可能看一些比较老的代码中还有format和%这样的格式化方法，现在基本都不用了。ipynb文件很好的一个点是，不用print也可以输出一个变量的值，但是仅限一个。开头的特殊字符,用于表示一些无法直接输入的字符或特殊功能。姓名: "小明", 城市: 北京。我的名字是小明，我住在北京。我的名字是小明，我住在北京。20 加 8 的结果是：28。20 除以 8 的余数是：4。

2025-11-11 20:47:12 204

原创从0开始学python（day16——函数的高级应用）

装饰器是Python中的特色语法，可以通过装饰器来增强现有的函数，这是一种非常有用的编程技巧。一些复杂的问题用函数递归调用的方式写起来真的很简单，但是函数的递归调用一定要注意收敛条件和递归公式，找到递归公式才有机会使用递归调用，而收敛条件确定了递归什么时候停下来。函数调用通过内存中的栈空间来保存现场和恢复现场，栈空间通常都很小，所以递归如果不能迅速收敛，很可能会引发栈溢出错误，从而导致程序的崩溃。

2025-11-11 10:00:00 991

原创从0开始学python（day15——函数的使用进阶）

Python中的函数可以使用可变参数*args和关键字参数**kwargs来接收任意数量的参数，而且传入参数时可以带上参数名也可以没有参数名，可变参数会被处理成一个元组，而关键字参数会被处理成一个字典。Python中的函数是一等函数，可以赋值给变量，也可以作为函数的参数和返回值，这也就意味着我们可以在Python中使用高阶函数。如果我们要定义的函数非常简单，只有一行代码且不需要函数名，可以使用Lambda函数（匿名函数）。

2025-11-10 10:00:00 813

原创从0开始学python（day14——函数的应用）

在写代码尤其是开发商业项目的时候，一定要有意识的将相对独立且重复出现的功能封装成函数，这样不管是自己还是团队的其他成员都可以通过调用函数的方式来使用这些功能。

2025-11-09 10:00:00 474

原创从0开始学python（day13——函数与模块）

数学上的函数通常形如y = f(x)或者这样的形式，在y = f(x)中，f是函数的名字，x是函数的自变量，y是函数的因变量；而在中，g是函数名，x和y是函数的自变量，z是函数的因变量。Python中的函数跟这个结构是一致的，每个函数都有自己的名字、自变量和因变量。我们通常把Python中函数的自变量称为函数的参数，而因变量称为函数的返回值。在Python中可以使用def关键字来定义函数，和变量一样每个函数也应该有一个漂亮的名字，命名规则跟变量的命名规则是一致的（赶紧想一想我们之前讲过的变量的命名规则）

2025-11-08 10:00:00 1302

空空如也

空空如也