- 博客(7)
- 收藏
- 关注
原创 机器学习之SVM
考虑一个二分类问题。假设输入空间与特征空间为两个不同的空间,这两个空间的元素一一对应,并将输入空间的输入映射为特征空间中的特征向量,支持向量机的学习是在特征空间进行的。假设一个特征空间上的训练数据集学习的目标是在特征空间中找到一个分离超平面,能够将实例分到不同的类,分离超平面对应于方程w*x + b = 0,它由法向量 w ww 和截距 b bb 决定。
2024-06-11 17:14:59 1129 1
原创 机器学习之逻辑回归
梯度就是导数梯度下降法就是一种通过求目标函数的导数来寻找目标函数最小化的方法。梯度下降目的是找到目标函数最小化时的取值所对应的自变量的值,目的是为了找自变量X。
2024-05-28 17:02:39 613
原创 机器学习之贝叶斯分类
贝叶斯分类算法是统计学中的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率作为该特征所属的类。
2024-05-14 18:23:28 757 1
原创 决策树的构建
决策树是一种树形结构,其中每个内部节点(Internal Node)表示一个特征(Feature),每个分支(Branch)表示一个特征取值的判断条件,而每个叶子节点(Leaf Node)表示一个类别(Classification)或者一个数值(Regression)。通过对特征的逐层划分,决策树可以对数据进行分类或者预测。
2024-04-30 17:00:19 616 1
原创 机器学习之模型评估
是指对于一种具体方法输出的最终模型,使用一些指标和方法来评价它的泛化能力。这一步骤通常在模型训练和模型选择之后,正式部署模型之前。模型评估方法不针对模型本身,只针对问题和数据,因此可以用来评价来自不同方法的模型的泛化能力,进行用于部署的最终模型的选择。
2024-04-16 16:57:56 1018
原创 KNN算法的python实现(海伦约会网站的推荐)
由于本文选取的训练集没有删除测试集选取的部分,所以k越大,拟合度越差。1图得点分散过于集中,可能是玩游戏和冰淇淋这俩因素得组合对海伦得对象选择没有较大影响,而2,3图像相同颜色点位分布离散,可以考虑对因素比重加权处理。K取值小的时候(如k==1),仅用较小的领域中的训练样本进行预测,模型拟合能力比较强。接着就是对距离差值从小到大排序,并且统计标签得频率,从最近的k个标签中选择相同标签最多的标签作为预测值。2.测试集数据分类,将海伦非常喜欢的标记为3,一般喜欢的标记为2,不喜欢滴标记为1。
2024-03-25 21:44:29 1066
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人