衍浒-CSDN博客

原创机器学习之主成分分析 PCA

一、引言主成分分析（Principal Component Analysis，PCA）是一种常用的方法，用于。它最早由卡尔·皮尔逊于1901年提出，是一种统计学方法，后来被广泛引入到机器学习领域。主成分分析的背景和意义主要体现在以下几个方面：1.数据降维：在现实世界中，许多数据集具有高维特征，这给数据的存储、可视化和分析带来了挑战。主成分分析可以帮助我们在不丢失太多信息的情况下，将高维数据转换为低维数据，从而简化数据集的复杂度。

2023-12-30 21:13:07 1450 1

原创机器学习之支持向量机

在支持向量回归中，我们的目标是通过构建一个超平面，使得尽可能多的训练样本点落在超平面的边界内，并且超平面与这些点之间的距离最小。通过调节C的值，我们可以控制模型对于错误分类的容忍程度。在支持向量机中，最大化决策边界的边缘是指找到一个超平面，使得它与离它最近的两个不同类别的样本点之间的距离最大化。它的目标是在保持较好的分类能力的同时，尽量减少错误分类样本的数量。其中，||w||是权重向量w的L2范数，C是一个调节参数，用于平衡模型复杂度和错误预测的权重，ξ_i和ξ_i*是松弛变量，用于容忍预测误差。

2023-12-18 21:38:56 1214 1

原创机器学习之Logistic回归

对于逻辑斯蒂回归，梯度的计算公式为：(\frac{\partial \ell(\theta)}{\partial \theta_j} = \sum_{i=1}^{m} (h_{\theta}(x_i) - y_i) x_{ij})，其中 (x_{ij}) 表示第 (i) 个样本的第 (j) 个特征值。在逻辑斯蒂回归中，假设样本的标签 (y_i) 是根据一个二元分布生成的，其中标签为1的概率为 (h_{\theta}(x_i))，标签为0的概率为 (1 - h_{\theta}(x_i))。

2023-12-04 21:18:06 382

原创机器学习之朴素贝叶斯算法

具体来说，假设有一个参数化模型，其中包含一个未知的参数 θ，我们的目标是通过已有的样本来估计 θ 的取值。同时，选择合适的算法和处理方法也是非常重要的，对于不同的问题，需要选择不同的算法来解决，这需要我们具备一定的理论知识和实践经验。具体地，设特征向量为 X = (x1, x2, ..., xn)，类别集合为 C = {c1, c2, ..., ck}，我们的目标是计算在给定特征向量 X 的条件下，属于每个类别的概率 P(ci|X)，然后选择具有最大后验概率的类别作为样本的分类结果。

2023-11-20 17:10:36 933 1

原创机器学习之决策树

在划分数据集之前之后信息发生的变化成为信息增益，知道如何计算信息增益，我们就可以计算每个特征值划分数据集获得的信息增益，获得信息增益最高的特征就是最好的选择。4.预测或分类：当新的数据样本进入决策树时，通过遍历树的路径，根据每个节点的划分规则将样本分配到对应的叶子节点。对于分类问题，叶子节点表示具体的类别；5.参数调优：决策树有一些参数可以进行调优，如决策树的最大深度、分裂节点的最小样本数、划分特征的方式等。在决策树中，每个节点的任务是选择一个最佳的特征来进行分割，使得分割后的子集尽可能地纯净。

2023-11-06 22:08:03 233

原创机器学习之模型评估

ROC 曲线以真正率（True Positive Rate）为纵轴，假正率（False Positive Rate）为横轴绘制，AUC 表示 ROC 曲线下的面积，可以作为评估模型分类性能的指标。仅有良好的数据和算法并不能保证一个好的模型，我们还需要通过模型评估来确定模型的性能和可靠性，并根据评估结果对模型进行进一步的调整和改进。最后，我们需要记住，更复杂的模型并不一定能得到更好的性能，模型的选择应根据问题的实际需要，遵循奥卡姆剃刀原则，即在能解决问题的所有模型中选取最简单的一个。

2023-10-23 21:56:27 448

原创 k-近邻算法

简单来说，k-近邻算法即采用测量不同特征值之间的距离方法来进行分类。工作原理：存在一个样本数据集合，也称作训练样本集，并且样本集中每个数据都存在标签，即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后，将新数据的每个特征与样本集中数据对应的特征进行比较，然后算法提取样本集中特征最相似数据(最近邻)的分类标签。一般来说，我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后，选择k个最相似数据中出现次数最多的分类，作为新数据的分类。

2023-10-09 21:45:14 216 1

原创 vs code和pytorch的下载

在pytorch官网中找到适合自己电脑的版本进行下载，我的相关语句为conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch 但是在cmd以及所配置环境中均下载失败，于是我又换了个语句install pytorch torchvision torchaudio cpuonly -c pytorch 但。3、下载时要先确定好所下载内容须在大环境或是定义好的环境中下载。

2023-09-25 21:53:49 275 1

原创 vscode与pytorch下载

官网中找到适合自己电脑的版本进行下载，我的相关语句为conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch 但是在cmd以及所配置环境中均下载失败，于是我又换了个语句install pytorch torchvision torchaudio cpuonly -c pytorch 但。3、下载时要先确定好所下载内容须在大环境或是定义好的环境中下载。

2023-09-25 21:43:35 750 1

weixin_63094874的博客