AI作业3-监督学习

最新推荐文章于 2024-07-17 21:40:42 发布

MoonCatTop

最新推荐文章于 2024-07-17 21:40:42 发布

阅读量84

点赞数 1

文章标签：人工智能学习机器学习

本文链接：https://blog.csdn.net/2301_76665413/article/details/129822482

版权

集成学习

集成学习是一种技术框架，其按照不同的思路来组合基础模型，从而达到更好的目的。集成学习有两个主要的问题需要解决，第一是如何得到若干个个体学习器，第二是如何选择一种结合策略，将这些个体学习器集合成一个强学习器。

支持向量机

支持向量机（SVM）是一类按监督学习方式对数据进行二元分类的广义线性分类器，其决策边界是对学习样本求解的最大边距超平面，可以将问题化为一个求解凸二次规划的问题。与逻辑回归和神经网络相比，支持向量机，在学习复杂的非线性方程时提供了一种更为清晰，更加强大的方式。

具体来说就是在线性可分时，在原空间寻找两类样本的最优分类超平面。在线性不可分时，加入松弛变量并通过使用非线性映射将低维度输入空间的样本映射到高维度空间使其变为线性可分，这样就可以在该特征空间中寻找最优分类超平面。

软间隔

软间隔SVM允许部分点分布在间隔内部，此时可以解决硬间隔SVM的问题（只需将异常点放到间隔内部即可），因为间隔内部的点对于SVM的思想来说是一种错误，所以我们希望位于间隔内部的点尽可能少，其实是一种折中，即在错误较少的情况下获得不错的划分超平面

核函数

假设函数Ф是一个从低维特征空间到高维特征空间的一个映射，那么如果存在函数K(x,z), 对于任意的低维特征向量x和z，都有：K(x,z)=θ(x)*θ(z),称函数K(x,z)为核函数(kernal function)

核函数是一个低纬的计算结果，并没有采用低纬到高维的映射。只不过核函数低纬运算的结果等价于映射到高维时向量点积的值。

VC维

VC维的直观定义

对一个指示函数集，如果存在h个样本能够被函数集中的函数按所有可能的2^h种形式分开，则称函数集能够把h个样本打散。
函数集的VC维就是它能打散的最大样本数目。
若对任意数目的样本都有函数能将它们打散，则函数集的VC维是无穷大。

VC维是一个评判模型复杂程度的工具。 VC维越大则模型的复杂度越高。

生成式模型

生成式模型一般会对每一个类建立一个模型，有多少个类别，就建立多少个模型。比如说类别标签有｛猫，狗，猪｝，那首先根据猫的特征学习出一个猫的模型，再根据狗的特征学习出狗的模型，之后分别计算新样本X跟三个类别的联合概率P(Y|X)，然后根据贝叶斯公式：分别计算 P(Y|X)，选择三类中最大的 P(Y|X)作为样本的分类。