机器学习
文章平均质量分 94
机器学习实验报告
又困又爱睡
这个作者很懒,什么都没留下…
展开
-
机器学习(八)——PCA
主成分分析(PCA)是一种常用的数据降维方法,它通过线性变换将原始数据变换为一组各维度线性无关的表示,通常用于高维数据的处理和可视化。ORL Dataset 是剑桥大学 AT&T 实验室制作的人脸数据集,其包含从 1992 年 4 月到 1994 年 4 月期间实验室成员的人脸图像。该数据集的图像分为 40 个不同主题,其中每个主题包含 10 幅图像。降低维度:PCA可以减少数据的维度,减少数据量,简化模型或可视化。去除噪声:PCA可以去除数据中的噪声和冗余信息,提高数据质量。原创 2023-12-19 20:04:49 · 881 阅读 · 0 评论 -
机器学习(七)——SVM
支持向量机(Support Vector Machine,简称SVM)是一种经典的机器学习算法,它在解决小样本非线性及高维模式识别等问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。是一种二分类模型监督性学习。目的是找到集合边缘上的若干数据(支持向量)用这些点找出一个平面(决策面)使支持向量到该平面的距离最大。原创 2023-12-06 20:03:47 · 903 阅读 · 0 评论 -
机器学习(六)——logistic回归
logistic回归是一种二分类或多分类的概率型非线性回归模型,用于研究因变量与影响因素之间的关系。其主要思想是根据现有数据对分类边界线建立回归公式,从而进行分类。与线性回归不同的是,logistics回归的目标是找到最佳拟合参数,以便对不同特征赋予不同的权重。源自《机器学习实战》数据集,形式为(x,y,label)模型简单:Logistic回归的模型结构简单,易于理解和实现。速度快:Logistic回归的计算速度相对较快,适合处理大量数据。原创 2023-11-28 00:08:13 · 953 阅读 · 0 评论 -
机器学习(五)——朴素贝叶斯
朴素贝叶斯算法是一种基于贝叶斯定理和条件独立性假设的分类方法。其中,朴素贝叶斯的朴素代表属性之间独立。该算法的核心思想分为两个部分:首先,基于特征条件独立性假设,算法学习输入和输出的联合概率分布。然后,利用贝叶斯定理,对于给定的输入特征 x,计算各个输出类别 y 的后验概率。垃圾邮件分类数据集是一组用于训练和测试垃圾分类模型的数据,主要包括不同类型垃圾的分类信息和相关特征。垃圾分类数据集可以,实现对垃圾的自动分类。新闻分类数据集是用于训练和测试新闻文本分类模型的数据集,包含大量新闻文章及其。原创 2023-11-14 21:45:28 · 127 阅读 · 0 评论 -
机器学习(四)——决策树
决策树是一种非参数的监督学习方法,通过对训练集数据学习,挖掘一定规则用于对新的数据集进行预测,通俗来说,是if-then决策集合。目的是使样本尽可能属于同一类别,分类更准确,通过递归选择最优特征对数据集进行分割,使每个子集都有一个最优分类过程。通过特征选择,选择最佳特征,将数据集分割成正确分类的子集。常用的特征选择及对应算法信息增益——ID3算法信息增益率——C4.5算法基尼系数——CART算法三个算法比较一览模型连续值缺失值ID3分类不支持不支持C4.5分类支持支持。原创 2023-11-03 02:33:29 · 121 阅读 · 0 评论 -
机器学习(三)——模型评估方法
机器学习模型的评估方法主要目的是了解模型在训练数据上的表现,以确定模型是否有过拟合或欠拟合的问题,以及模型在新数据上的泛化能力。机器学习模型的评估方法涉及到多个方面,包括损失函数、训练误差、验证误差、测试误差、交叉验证、模型选择等。通过综合考虑这些因素,可以优化模型的性能,并选择具有较好泛化能力的模型。使用了Scikit-learn库中的函数生成了一个二分类数据集,并使用函数将其划分为训练集和测试集。# 生成数据集# 划分训练集和测试集。原创 2023-10-18 14:53:26 · 238 阅读 · 1 评论 -
机器学习(二)——KNN算法
机器学习实验报告(二)——基于KNN算法实现鸢尾花分类和数字信号1-5的分类原创 2023-09-29 13:38:56 · 258 阅读 · 0 评论 -
机器学习(一)
机器学习实验报告一原创 2023-09-15 22:54:57 · 107 阅读 · 0 评论