AI-第三次作业-监督学习
1、集成学习
集成学习就是将多个弱监督学习模型组合为一个更好更全面的强监督模型。而集成学习并不能称得上为一个单独的学习算法,是通过构建并结合多个机器学习器来完成任务的。
2、支持向量机
一种通过按照监督方式来对数据进行二元分类的广义线性分类器。可将问题化为求解二凸性规划问题。
3、软间隔
软间隔本质上也是支撑向量,在支撑向量围成的区域内,还有其他数据点,这些数据点在被优化函数计算时也会被考虑在内。支撑向量与超平面之间距离不稳定的请款就称之为软间隔。
4、核函数
核函数将原始数据映射到高维空间,从而使数据在高维空间内容易区分。
5、VC维
全称为Vapnik-Chervonenkis Dimension,它作为一个反应模型学习能力的参数,VC维越大,模型的容量就越大。
6、生成式模型
观测样本和标签的联合概率分布,可用于无监督学习和监督学习。
7、判别式模型
直接学习预测函数或者条件概率分布作为预测。
8、生成式模型和判别式模型各有什么优缺点?
生成式模型优点:过拟合概率较小,尤其是当采集数据的分布与整体数据的分布相近的适合。
生成式模型缺点:分布函数可能会由异常点而导致数据不那么准确,生成模型需要大量的数据,相比判别式模型,计算量更大。
判别式模型优点:在数据集较小时,表现很好,而且计算量相较于生成式模型也更小。简化学习问题。
判别式模型缺点:学习速度不如生成式模型,无法应对存在隐藏变量的情况。
9、监督学习是判别式方法,无监督学习是生成式方法?
判别式方法和生成式方法都属于监督学习方法。
10、分类是判别式方法,聚类是生成式方法?KNN,K-means分别是什么方法?
分类既是判别式方法又是生成式方法,同一任务都可用判别式和生成式方法,但是方式不同。
聚类既是判别式方法又是生成式方法,不过聚类问题较多使用生成式解决。
KNN K近邻算法,属于监督算法,分类算法,是判别式方法。
K-means K均值聚类 属于无监督学习,聚类算法,随机算法,是生成式方法。