自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习:主成分分析(PCA)

主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维方法。它通过线性变换将原始数据变换到一个新的坐标系中,使得第一个坐标(第一主成分)具有最大的方差,第二个坐标(第二主成分)具有次大的方差,以此类推。PCA的目的是从高维数据中提取出最重要的特征,通过保留最重要的主成分来实现数据的降维,同时尽可能保留原始数据的结构。

2024-06-22 11:41:45 875

原创 机器学习:支持向量机

上述将数据集分割开来的直线称为分割超平面(separating hyperplane)。上图中,由于数据点都在二维平面上,所以分割超平面只是一条直线。如果,所给数据集是三维的,此时用来分隔数据的就是一个平面。以此类推,当给定的数据集是N维数据时,其分割对象就是N-1维的。该对象被称为。

2024-06-11 19:28:44 957

原创 机器学习:逻辑回归

为了实现Logistic回归分类器,我们可以在每个特征上都乘以一个回归系数,然后把所有的结果值相加,将这个总和代入Sigmoid函数中,进而得到一个范围在0~1之间的数值。在训练过程中,损失函数的目的是指导模型如何调整参数以减少这种不一致性,从而提高模型的预测准确性。逻辑回归是基于线性回归的基础上,再加上Sigmoid函数,将线性回归的得到的预测值输出映射到0和1之间的概率。在逻辑回归中,似然函数可以表示为。训练模型后,我们可以使用模型来预测新样本的类别标签,预测类别标签的方法是,将新样本的特征向量代入。

2024-05-28 18:47:53 889

原创 机器学习 基于概率论的分类方法:朴素贝叶斯

朴素贝叶斯是贝叶斯决策理论中的一部分,而贝叶斯决策理论是基于贝叶斯定理的一种统计方法,因此我会先为大家介绍何为“贝叶斯定理”。通过构建朴素贝叶斯分类器模型并对乳腺癌数据集进行分类,我体会到朴素贝叶斯算法的简洁性和解释性。朴素贝叶斯分类器的结构非常直观,易于理解,这使得它在很多领域都有广泛的应用。同时,也需要注意朴素贝叶斯算法对特征独立性的假设,这可能会降低模型的准确性。y_%7Bk%7D。

2024-05-04 18:08:53 928

原创 机器学习第三章 决策树

基于信息理论的背景下,信息的定义如下:信息(Information)可以理解为能够减少不确定性的数据。在信息理论中,信息被量化为一个事件发生的概率的负对数。如果一个事件的发生概率很高,那么它提供的信息就很少;相反,如果一个事件的发生概率很低,那么它提供的信息就很多。信息的计算公式如下:其中表示可能发生的某一事件,表示事件xi发生的概率,是事件xi的信息量。信息熵(Entropy)是信息理论中的一个核心概念,它量化了一个随机变量不确定性的大小。在机器学习中,

2024-04-30 18:28:14 1119

原创 机器学习 实验二:模型评估

PR曲线(Precision-Recall Curve)和ROC曲线(Receiver Operating Characteristic Curve)都是用于评估分类模型性能的工具,它们侧重点不同,因而应用的场景也不同。PR曲线主要关注模型在召回率(Recall)方面的表现,即模型能够正确识别正类的比例。特别适用于类别不平衡的数据集,其中正类样本数量远少于负类样本。在这种情况下,模型可能更关注召回率,因为它可以帮助识别更多的正类样本。PR曲线下的面积(Average Precision,AP。

2024-04-15 20:20:07 716

原创 机器学习实验一:k-近邻算法 实验

kNN算法概述以及鸢尾花案例的应用

2024-04-06 23:41:03 817

原创 Anaconda和VScode的安装流程

Anaconda和VScode的安装流程~~

2024-03-12 22:32:54 1338 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除