自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 机器学习 实验课8 PCA主成分分析

PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴选择是原始数据中方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大的,第三个轴是与第1,2个轴正交的平面中方差最大的。

2023-12-19 15:22:21 939 1

原创 机器学习 实验课7 支持向量机(SVM)

支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的。

2023-12-14 17:20:45 533 1

原创 机器学习 实验课6 logistic回归

优点:Logistic回归具有良好的可解释性,可以通过模型参数来理解不同特征对分类结果的影响。Logistic回归适用于许多实际应用中的二分类问题,比如信用评估、医疗诊断、垃圾邮件过滤等。Logistic回归计算速度快,易于实现和部署,因此在大规模数据处理和实时预测场景下表现良好。缺点:Logistic回归也具有一定的局限性,例如它只能处理线性可分问题,对于非线性问题需要通过特征工程或采用其他模型来解决。

2023-11-29 20:32:05 181 1

原创 机器学习 实验课5 朴素贝叶斯算法

在机器学习中,贝叶斯公式被广泛应用于贝叶斯统计、贝叶斯分类等领域。通过使用贝叶斯公式,我们可以根据已有的信息(先验概率)和新的观察结果(似然度)来更新我们对事件的概率信念(后验概率)。这种基于贝叶斯公式的推断方法在处理不确定性和进行概率推断时非常有用。

2023-11-21 14:46:44 102

原创 机器学习 实验4 决策树

决策树是一种常用的分类与回归算法,它具有以下优点:易于理解和解释、计算复杂度较低、对数据的预处理要求不高、能够同时处理多种数据类型以及具有较强的可解释性。此外,决策树还可以通过剪枝等手段来防止过拟合。然而,决策树也有一些缺点:容易出现过拟合问题、对于连续型数据比较难处理、类别样本数量不均衡时容易偏向于数量较多的类别、对错误或者异常值比较敏感等。此外,由于决策树在构建过程中需要进行特征选择,因此可能会选择次优特征,导致最终的决策树不是全局最优的。这时,剪枝操作便能很好的避免决策树的过拟合现象。

2023-11-06 20:19:57 310

原创 机器学习 实验课3 模型评估

在绘制KNN算法的ROC曲线图时,采用sklearn中的鸢尾花数据集测试时,运行会报错,通过查阅资料得知,ROC对于评估和比较二分类模型的性能非常有用,但是鸢尾花数据集并不是二元模型,导致运行失败。ROC曲线适合评估样本类别相对均衡的情况:当正负样本数量差异不大时,ROC曲线能够提供全面的分类器性能评估。它对真正例率(TPR)和假正例率(FPR)的不同阈值下的变化进行可视化,能够直观地展示模型在不同阈值下的整体性能。ROC曲线的优点是能够评估分类器在不同阈值下的敏感性和准确性。

2023-10-19 21:57:51 375

原创 机器学习 实验课2 KNN近邻算法

k近邻算法是分类数据最简单最有效鄂算法,本次实验通过鸢尾花实例学习如何使用k近邻算法构造分类器。k近邻算法是基于实例的学习,使用算法时我们必须有接近实际数据的训练样本数据。k近邻算法必保存全部数据集,如果训练数据集很大,必须使用大量的存储空间。此外,由于必须对数据集中的每个数据计算距离值,实际使用时可能非常耗时。k近邻的另一个缺陷是他无法给出任何数据的基础结构信息,因此我们也无法知晓平均实例样本和典型实力样本具有什么特征。

2023-10-08 23:50:08 372

原创 机器学习 实验课1

通过安装和实验Anaconda可以使机器学习的开发和实验变得更加简单和高效。它提供了一站式的解决方案,集成了常用的数据科学库和工具,并且与VS Code的结合使用,使得我们可以在一个统一的环境中完成整个机器学习流程。这为我们提供了良好的基础,使得我们可以更好地专注于算法和模型的研究和应用。

2023-09-17 21:38:16 109 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除