自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 实验八 PCA主成分分析

PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法)。其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,发现更便于人类理解的特征。也可以用来削减回归分析和聚类分析中变量的数目。1、PCA算法通过寻找协方差矩阵的特征值最大的K个特征向量,以作为新的一组基,将原数据映射到这一组新的基上来完成数据的降维,也就是说PCA算法可以找到前K个主成分。

2024-06-21 22:41:45 740

原创 实验七 SVM支持向量机

当C比较小时,模型对错误分类的惩罚较小,比较松弛,之间的间隔就比较大,可能会产生欠拟合的情况;当C比较大时,模型对错误分类的惩罚就大,因此两组数据之间的间隔就小,容易产生过拟合的情况。我们可以看到,图b分割虚线和实线之间的距离比较大,而图c分割虚线和实线之间的距离比较小。SVM 适合中小型数据样本、非线性、高维的分类问题。_init_ 函数:初始化方法,设置 self 代表的是类的实例,C 代表正则化参数。fit 函数:其中 self 是实例,X,y是输入,lr 是学习率,epochs 指定了训练的轮数。

2024-06-11 12:11:47 932

原创 实验六 逻辑回归

1. Logistic回归不适用于解决回归问题,它适用于解决分类问题。2. Logistic回归 = 线性回归 + Sigmoid 函数。3.实验结果表明,逻辑回归在这个二分类问题上表现良好,具有较高的准确率。w%3Dw+b1*b+...+x_%7Bi%7D。

2024-05-28 12:28:44 1989

原创 实验五 朴素贝叶斯

1、 本次实验为西瓜的好瓜坏瓜分类,从条件概率的格式推演到csv文件分类的基本实现,再到最终的好瓜坏瓜分类,做了一系列的操作。利用朴素贝叶斯来进行的好处就是,朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率,并且算法也比较简单,容易实现,对于小规模的数据效果很不错。2、通过此次实验,对朴素贝叶斯算法的整体流程以及原理有了更加深刻的理解,并且能进行简单的应用。3、朴素贝叶斯算法易于理解,操作简单。...+...+

2024-05-14 16:18:13 621 1

原创 实验四 决策树

决策树是一类常见的机器学习方法,可以帮助我们解决分类与回归两类问题。模型可解释性强,模型符合人类思维方式,是经典的树形结构。分类决策数模型是一种描述对实例进行分类的树形结构。1、决策树作为经典分类算法,具有计算复杂度低、结果直观、分类效率高等优点。2、学习通过用sk-learn库对西瓜数据集,进行ID3算法代码实现,通过sklearn库和graphviz库C4.5的算法代码实现。

2024-04-30 11:30:00 583 1

原创 实验二 KNN算法

答案是通过交叉验证(将样本数据按照一定比例,拆分出训练用的数据和验证用的数据,比如6:4拆分出部分训练数据和验证数据),从选取一个较小的K值开始,不断增加K的值,然后计算验证集合的方差,最终找到一个比较合适的K值。假设K=3,那么KNN算法就会找到与它距离最近的三个点,判断哪种类别多一些,比如这个例子中是蓝色三角形多一些,这样红色矩形就归类到蓝三角形的类别。——k=1的K近邻算法被称为最近邻算法,此时将训练集中与测试样本点最接近的点的类别作为测试样本的分类标签。优点:有效的减少“学习“的估计误差。

2024-04-16 12:48:27 671

原创 实验三——分类模型评估指标

ROC(Receiver Operating Characteristic)曲线,又称接受者操作特征曲线。该曲线最早应用于雷达信号检测领域,用于区分信号与噪声。后来人们将其用于评价模型的预测能力,ROC 曲线是基于混淆矩阵得出的。PR曲线就是精确率(Precision)召回率(Recall )曲线,以Recall作为横坐标轴,Precision作为纵坐标轴,PR曲线代表的是精确率与召回率的关系。

2024-04-16 12:47:41 750

原创 KNN算法的实现

输入没有标签的数据后,将这个没有标签的数据的每个特征与样本集中的数据对应的特征进行比较,然后。2、对训练数据依赖度特别大,虽然所有机器学习的算法对数据的依赖度很高,但是KNN尤其严重,因为如果我们的训练数据集中,有一两个数据是错误的,刚刚好又在我们需要分类的数值的旁边,这样就会直接导致预测的数据的不准确,对训练数据的容错性太差。1、效率低,因为每一次分类或者回归,都要把训练数据和测试数据都算一遍,如果数据量很大的话,需要的算力会很惊人,但是在机器学习中,大数据处理又是很常见的一件事。

2024-03-31 15:30:19 1705

原创 第一次实验 VS Code以及anaconda的安装与配置

由于实验课之前已经进行过VS Code以及anaconda的安装配置。由于课程要求主要是为了满足关于python编程的代码需求。所以以下展示关于这两个软件的一些配置截图。

2024-03-15 19:28:22 202 1

原创 PTA 分寝室 Java

学校新建了宿舍楼,共有 n 间寝室。等待分配的学生中,有女生 n0​ 位、男生 n1​ 位。所有待分配的学生都必须分到一间寝室。所有的寝室都要分出去,最后不能有寝室留空。现请你写程序完成寝室的自动分配。

2023-10-29 12:14:34 323

原创 python 调用函数实现——斐波纳契数列

Python 函数定义及应用--斐波那契数列

2023-03-19 12:51:12 1627

实验五朴素贝叶斯西瓜数据集

实验五朴素贝叶斯西瓜数据集

2024-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除