自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 机器学习作业7——PCA

这里是主要部分,第一行就是创建个pca对象,指定主成分数量为2(也就是接下来往这个对象中传入数据,返回出来的是二维特征的数据),然后第二行就是将数据集扔进去,也就是X_scaled,可以看到左图的黄绿点比较混杂,而右图的黄绿点左右分的比较开,两张图的蓝点都比黄绿点分的开。,其中白数据的X与Y是不相关的,所以协方差为0,而对角线上为方差,并且X与Y是标准正态分布,所以为1。协方差的意义是:表示X与Y的相关程度,若正相关,协方差大于0,负相关则小于0,若几乎为0,则不相关。

2024-06-14 00:55:43 1485

原创 机器学习作业6——svm支持向量机

最关键的部分就是这里了,但是这里在上面理论部分的梯度下降法里头说明了,dw是L对w求偏导,db同理,lr是学习率,这个条件的意义是:当在当前超平面下,分割出来的当前这个样本点如果是正确的,并且处于间隔外,在惩罚中就不需要加入松弛参数变出的那一项。一开始把梯度下降法和SMO算法混起来了,主要是对梯度下降的损失函数和W的更新式子不知道怎么得出的,然后先去学了一遍拉格朗日函数,在看SMO理论的时候,感觉很难,不太像是梯度下降,回头多看了看最开始得出的目标函数。有了松弛变量后,就允许了一部分点可以被错误的分类。

2024-06-08 19:47:02 909 1

原创 机器学习作业5——逻辑回归

对着已有的权值,不断找最小值就可以了,而每次找最小值,就需要用到和,至于损失函数或者最大似然函数,实际上不需要知道他们的值,只需要知道我们正在往最小值靠近就好。所以每次迭代的时候要做的事情就是:1、求偏导,2、参数更新。当然存在一种情况就是,可能卡在是极小值,或是驻点,而不是最小值的地方。对于这种情况,可以反复调整学习率和最开始初始化的权值,来探索不一样的区间,到最后能找到一个合适的参数即可,不需要过分完美。假如训练完了,该如何预测呢?

2024-05-23 08:15:00 703 2

原创 机器学习作业4——朴素贝叶斯分类器

这个函数用于测试集的预测,对于测试集中的每个元组,都要对于所有类别,计算一次该类别下的后验概率,然后选择所有类别中后验概率最大的,作为预测结果,而每个后验概率,通过该元组下的每个特征下的类型对应的条件概率的累乘和该类别的先验概率的乘积来确定。这个训练集数据过小,但是特征和每个特征中的类型又比较多,再加上测试集一共就13条,数据使用不同的随机种子会使得一些测试集中的特征在不同类别下的条件概率没有出现过,因为没有出现过,直接就不处理这个特征了,就容易出现误差。可以看到P(A|X)比较大,所以是A类​。

2024-05-12 22:45:21 713

原创 机器学习作业3____决策树(CART算法)

CART(Classification and Regression Trees)是一种常用的决策树算法,可用于分类和回归任务。这个算法由Breiman等人于1984年提出,它的主要思想是通过递归地将数据集划分为两个子集,然后在每个子集上继续划分,直到满足某个停止条件为止。CART算法在分类和回归问题上表现良好,并且能够处理多种数据类型(包括离散型和连续型特征)。由于其简单、易于理解和实现,以及在一些应用中的良好性能,CART算法被广泛应用于实践中。

2024-04-25 18:29:56 1942 1

原创 机器学习作业二之KNN算法

KNN(K- Nearest Neighbor)法即K最邻近法,最初由 Cover和Hart于1968年提出,是一个理论上比较成熟的方法,也是最简单的之一。该方法的思路非常简单直观:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。该方法的不足之处是计算量较大,因为对每一个待分类的文本都要计算它到全体已知样本的距离,才能求得它的K个最邻近点。

2024-03-24 21:23:03 1907 4

原创 机器学习作业1,安装anaconda和pycharm

之后就是install了,然后会提示你要不要安装vscode,如果有需要,就安装。输入conda --version和conda info,弹出信息即可。进入之后,piugins内搜索chinese,即可改为中文。第一个是添加环境变量,手动添加麻烦,自动就好。然后打开,目录自己改,一直到这里,全勾了。接下来怎么激活就各显神通了。2.安装pycharm。

2024-03-10 14:55:09 133

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除