自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习之主成分分析(PCA)

PCA是一种强大的降维工具,特别适用于高维数据的处理。它可以显著减少数据维度,提高计算效率,并有助于数据的可视化。然而,PCA也有其局限性,例如对非线性数据效果不佳以及主成分解释性差。在实际应用中,选择适当的主成分数量至关重要,以在降维和信息保留之间取得平衡。通过理解PCA的优缺点,我们可以更好地应用PCA,并在适当的场景中使用其他补充方法,如非线性降维技术(例如t-SNE和UMAP),以获得更好的降维效果。

2024-06-18 10:39:10 1035

原创 机器学习之SVM算法

支持向量机(SVM)是一种监督学习算法,主要用于解决分类和回归问题。其核心思想是在特征空间中寻找一个最优的超平面来实现不同类别之间的分割,同时使得这个超平面与最近的样本点之间的距离最大化,即间隔最大化。不同松弛变量c下的图像变化:当c等于50时:当c等于200时:当c等于500时:我们可以很轻松的看出,当c比较小时,我们的分类并不好,还有一些点没有正确分类,导致过拟合。当c等于200时,这时我们的间隔刚好,说明分类得很好。而当c值过大时,黄色的圆点甚至都没有一个被作为支持向量 ,导致欠拟合。

2024-06-11 10:43:51 1047

原创 机器学习之逻辑回归

优点:逻辑回归的优点包括其简单性、易于理解以及高效性。它不需要复杂的数学运算,因此在处理大型数据集时表现良好。局限性:逻辑回归也有局限性,比如它不能很好地处理非线性关系,且对于高度相关的输入特征可能会产生多重共线性问题。逻辑回归是一个强大的机器学习算法,尤其适用于二分类问题。通过理解和应用逻辑回归的基本原理,我们可以构建出能够预测分类结果的模型。虽然它在某些复杂场景下可能不是最佳选择,但在许多实际应用中,逻辑回归仍然是快速而有效的解决方案。

2024-05-28 12:15:32 937

原创 机器学习之朴素贝叶斯

在分类过程中,朴素贝叶斯分类器假设各个特征之间相互独立,尽管在实际情况中这一假设可能不完全成立,但实验结果表明,朴素贝叶斯依然能够提供相当准确的分类效果。通过计算给定特征值下好瓜和坏瓜的条件概率,并乘以先验概率,分类器得到了后验概率,即给定特征值下西瓜是好瓜或坏瓜的概率。朴素贝叶斯分类器在西瓜分类实验中表现出了良好的性能,它的简单性和有效性使其成为解决实际问题中的一个有价值的工具。),然后遍历测试集的特征,计算每个特征的条件概率,并更新后验概率的对数。最后,将后验概率的对数转换回原始概率形式,并输出结果。

2024-05-14 13:41:28 704 1

原创 机器学习之决策树的构建

是一种用来构建决策树的机器学习算法。它的核心在于使用信息增益作为属性选择的标准来递归地划分数据,生成决策树。:信息熵是衡量数据集纯度的一个重要指标,它代表了数据的不确定性或混乱程度。在ID3算法中,信息熵被用来衡量一个数据集中的随机变量的不确定性。其计算公式为其中 p(xi​) 是分类 (xi ) 出现的概率,n 是分类的数目。:信息增益是指在知道某个特征的信息之后,数据集不确定性减少的程度。在ID3中,选择具有最大信息增益的特征作为当前节点的最优划分属性。

2024-04-29 09:01:56 793 1

原创 机器学习之模型评估

根据这个实验,我们可以总结出:1.当我们的数据集太过于简单时,ROC曲线就可能非常完美,并且不同K值下的 ROC曲线图都可能一样,就如我们的 图3.1。因此,我们在进行实验时的数据集应该是多样化的,多数量的。2.当我们的数据集足够大时,不同K值下的ROC曲线图可能都会不一样,正如图 3.2 ,我们的K值变化也会影响着ROC曲线图的评估性能,并且不是K值越大(或越小)ROC曲线图的性能越好,因此,我们在进行KNN邻近算法时,应该选取合适的K值进行KNN分类。

2024-04-16 13:50:24 1377 1

原创 Anaconda安装教程

"all users"选项表示将Anaconda安装到计算机上的所有用户都可以使用。这意味着软件和工具集将对每个用户帐户进行安装,需要更长的安装时间和更多的磁盘空间。"just me"选项表示仅对当前用户安装Anaconda,只有该用户才能使用安装的软件和工具集。这可以使安装过程更快,同时减少对系统的影响。在安装Anaconda时,"just me"和"all users"是安装程序中的选项,用于指定用户范围。中的文件,然后就是环境变量里关于python的所有东西。5.选择安装路径,尽量选择c盘以外安装。

2024-04-02 16:43:53 985 1

原创 机器学习之KNN算法

KNN(K-NearestNeighbor)是机器学习入门级的分类算法,非常简单。它实现将距离近的样本点划为同一类别;KNN中的K指的是近邻个数,也就是最近的K个点;根据它距离最近的K个点是什么类别来判断属于哪个类别。近朱者赤,近墨者黑,物以类聚,人以群分。KNN算法就是这样。它使相同类别的样本在特征空间中聚集在一起。

2024-04-02 16:43:35 609 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除