- 博客(6)
- 收藏
- 关注
原创 机器学习之支持向量机(SVM)
SMV在众多实例中寻找一个最优的决策边界,这个边界上的实例叫做支持向量,它们“支持”(支撑)分离开超平面,所以它叫支持向量机。那么我们如何保证我们得到的决策边界是最优的呢?如上图,三条黑色直线都可以完美分割数据集。由此可知,我们仅用单一直线可以得到无数个解。那么,其中怎样的直线是最优的呢?如上图,我们计算直线到分割实例的距离,使得我们的直线与数据集的距离尽可能的远,那么我们就可以得到唯一的解。最大化上图虚线之间的距离就是我们的目标。而上图中重点圈出的实例就叫做支持向量。这就是支持向量机。
2024-06-10 23:12:09
233
原创 机器学习之逻辑回归
逻辑回归是一种监督学习分类算法,用于预测对离散类集的观察值。实际上,它被用来将观测结果划分为不同的类别。因此,它的输出本质上是离散的。逻辑回归也称为Logit回归。它是用于解决分类问题的最简单、直接和通用的分类算法之一。逻辑斯谛回归是经典的分类方法,它属于对数线性模型,原理是根据现有的数据对分类边界线建立回归公式,以此进行分类。
2024-05-28 22:46:54
392
1
原创 机器学习之贝叶斯定理
在信息和条件有限的情况下,基于过去的数据,通过动态调整的方法,帮助我们一步步预测出事件发生的接近真实的概率。其根本思想是【后验概率 = 先验概率 * 调整因子】,其中【先验概率】就是在信息不完整情况下做出的主观概率预测;【调整因子】则是在信息收集不断完善的过程中对先验概率的调整;【后验概率】则是经过调整后最终作出的概率预测。
2024-05-13 21:45:06
657
原创 机器学习之决策树
决策树算法是最流行的机器学习算法之一。它使用树形结构和它们的可能组合来解决特定的问题。它属于监督学习算法的一类,它可以用于分类和回归目的。决策树是一个包含根节点、分支节点和叶节点的结构。每个内部节点表示对一个属性的测试,每个分支表示测试的结果,每个叶子节点保存一个类标签。树中最顶层的节点是根节点。
2024-04-25 16:27:04
612
原创 Knn算法学习
9.对副本进行标准化处理(除了outcome列)使得每个特征均值为0,标准差为1,加快模型的收敛速度方便进行knn算法,X为特征部分。16.使用已经训练好的 K 最近邻分类器对测试集进行预测,得到预测结果 并使用热力图显示预测结果和实际结果的混淆矩阵。2.加载数据集,利用pandas库的head()方法,查看数据集的前五条记录,初步了解数据集的结构和内容。4.创建数据集的副本并将存在零值的列中的零值替换成缺失值,统计副本每列的缺失值数量。5.显示数据集的直方图,选择为副本的缺失值填充的值。
2024-03-31 00:26:00
368
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人