weixin_62209973-CSDN博客

原创机器学习——PCA主成分分析

主成分分析（Principal Component Analysis，简称PCA）是一种常用的数据降维技术，用于发现数据中的主要特征。PCA的基本思想是将高维数据转换为低维数据，同时最大程度地保留原始数据的信息。它通过线性变换将原始数据投影到一个新的坐标系上，使得在新的坐标系下数据的方差最大。这些新的坐标轴被称为主成分，每个主成分都是原始数据的线性组合。PCA的应用包括降维、数据可视化、特征提取等。它可以帮助我们理解数据中的主要变化模式，并且在一定程度上减少数据的复杂性和存储空间。

2024-01-02 01:34:43 875 1

原创机器学习——支持向量机（SVM）

SVM是一种二类分类模型（用于分类和回归分析的监督学习算法），其基本模型定义为特征空间上的间隔最大的线性分类器，即的学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。

2023-12-18 21:30:00 901

原创 Logistic回归以及python实现

是机器学习中一类常用的模型，用于建立输入特征与输出变量之间的线性关系。回归是线性模型的一种应用，用于预测连续数值型的输出变量。在线性回归中，我们假设输入特征与输出变量之间存在线性关系。具体来说，对于给定的输入特征 x1, x2, ..., xn，线性回归模型的形式可以表示为：当n为1的时候就是最简单的一元一次方程模型：其中，y是预测的输出变量，x1, x2, ..., xn是输入特征，w1, w2, ..., wn是对应的权重，b是偏置项。

2023-12-04 23:46:05 1002

原创朴素贝叶斯分类

朴素贝叶斯分类（Naive Bayes classification）是一种基于贝叶斯定理和特征条件独立假设的分类方法。它是一种简单而高效的分类算法，在文本分类、垃圾邮件过滤、情感分析等领域得到广泛应用。具体来说，朴素贝叶斯分类器中的“朴素”指的是特征之间独立的假设，即在给定类别的情况下，每个特征与其他特征之间是相互独立的。这个假设虽然在实际应用中并不总是成立，但在很多情况下，朴素贝叶斯分类仍然能够取得较好的分类效果，并且具有较强的鲁棒性。

2023-11-27 20:45:14 1105 1

原创机器学习——决策树

决策树是一种基于树状结构的机器学习模型，用于分类和回归问题。它通过对数据集进行逐步分割，生成一棵树来进行决策和预测。树上的每个节点代表一个特征属性或一个判断条件，每个叶子节点代表一个类别标签或一个数值结果。以下是一个决策树模型实例：一家网店的商品是否会被下架。

2023-11-06 21:30:00 67

原创 ROC曲线以及PR曲线的原理以及python实现

PR曲线是Precision-Recall（精确率-召回率）曲线的简称，用于评估二分类模型在不同阈值下的性能表现。PR曲线的横轴是召回率（Recall），纵轴是精确率（Precision），通过绘制不同阈值下的精确率和召回率之间的关系，可以直观地展示模型在不同阈值下的整体性能。是衡量模型对实际正例样本的识别能力，即模型能够正确预测出多少实际正例。计算公式为：Recall=TP/(FN+TP)。是衡量模型在预测为正例的样本中真正为正例的比例，即模型预测为正例的样本中有多少是真正的正例。

2023-10-23 21:45:00 160

原创 Anaconda，VS code ，pytorch的安装

方法一：通过官网下载Anaconda点击官网右上角Free Download下载方法二：若官网下载速度慢，可通过清华大学镜像下载。

2023-10-23 14:52:24 50

原创 KNN算法

在函数内部，遍历训练集train_set中的每个数据点，并计算其与输入数据点之间的距离。将计算的结果以字典的形式存储在res列表中，包括训练数据点的分类结果和与输入数据点的距离。在KNN算法中，通过将新的输入样本与训练样本进行相似度度量，来进行分类或回归预测。遍历测试集test_set中的每个数据点，分别计算其真实分类结果和KNN分类结果，并统计分类准确的样本数量。定义了计算欧氏距离的distance函数，用于计算两个数据点之间的距离，并设置K值为5。输出结果中：B为良性（无癌症），M为恶性（有癌症）

2023-10-09 21:45:00 36 1

weixin_62209973的博客