m0_敲代码的彭于晏168-CSDN博客

原创机器学习：主成分分析（PCA）

主成分分析（Principal Component Analysis，PCA）是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中，使得第一个坐标（第一主成分）具有最大的方差，第二个坐标（第二主成分）具有次大的方差，以此类推。PCA的目的是从高维数据中提取出最重要的特征，通过保留最重要的主成分来实现数据的降维，同时尽可能保留原始数据的结构。

2024-06-22 11:41:45 875

原创机器学习：支持向量机

上述将数据集分割开来的直线称为分割超平面（separating hyperplane）。上图中，由于数据点都在二维平面上，所以分割超平面只是一条直线。如果，所给数据集是三维的，此时用来分隔数据的就是一个平面。以此类推，当给定的数据集是N维数据时，其分割对象就是N-1维的。该对象被称为。

2024-06-11 19:28:44 957

为了实现Logistic回归分类器，我们可以在每个特征上都乘以一个回归系数，然后把所有的结果值相加，将这个总和代入Sigmoid函数中，进而得到一个范围在0~1之间的数值。在训练过程中，损失函数的目的是指导模型如何调整参数以减少这种不一致性，从而提高模型的预测准确性。逻辑回归是基于线性回归的基础上，再加上Sigmoid函数，将线性回归的得到的预测值输出映射到0和1之间的概率。在逻辑回归中，似然函数可以表示为。训练模型后，我们可以使用模型来预测新样本的类别标签，预测类别标签的方法是，将新样本的特征向量代入。

2024-05-28 18:47:53 889

原创机器学习基于概率论的分类方法：朴素贝叶斯

朴素贝叶斯是贝叶斯决策理论中的一部分，而贝叶斯决策理论是基于贝叶斯定理的一种统计方法，因此我会先为大家介绍何为“贝叶斯定理”。通过构建朴素贝叶斯分类器模型并对乳腺癌数据集进行分类，我体会到朴素贝叶斯算法的简洁性和解释性。朴素贝叶斯分类器的结构非常直观，易于理解，这使得它在很多领域都有广泛的应用。同时，也需要注意朴素贝叶斯算法对特征独立性的假设，这可能会降低模型的准确性。y_%7Bk%7D。

2024-05-04 18:08:53 928

原创机器学习第三章决策树

基于信息理论的背景下，信息的定义如下：信息（Information）可以理解为能够减少不确定性的数据。在信息理论中，信息被量化为一个事件发生的概率的负对数。如果一个事件的发生概率很高，那么它提供的信息就很少；相反，如果一个事件的发生概率很低，那么它提供的信息就很多。信息的计算公式如下：其中表示可能发生的某一事件，表示事件xi发生的概率，是事件xi的信息量。信息熵（Entropy）是信息理论中的一个核心概念，它量化了一个随机变量不确定性的大小。在机器学习中，

2024-04-30 18:28:14 1119

原创机器学习实验二：模型评估

PR曲线（Precision-Recall Curve）和ROC曲线（Receiver Operating Characteristic Curve）都是用于评估分类模型性能的工具，它们侧重点不同，因而应用的场景也不同。PR曲线主要关注模型在召回率（Recall）方面的表现，即模型能够正确识别正类的比例。特别适用于类别不平衡的数据集，其中正类样本数量远少于负类样本。在这种情况下，模型可能更关注召回率，因为它可以帮助识别更多的正类样本。PR曲线下的面积（Average Precision,AP。

2024-04-15 20:20:07 716

原创机器学习实验一：k-近邻算法实验

kNN算法概述以及鸢尾花案例的应用

2024-04-06 23:41:03 817

原创 Anaconda和VScode的安装流程

Anaconda和VScode的安装流程~~

2024-03-12 22:32:54 1338 1

m0_73907210的博客