人工智能第三次作业

本文介绍了集成学习、支持向量机和软间隔的概念,探讨了核函数在处理线性不可分数据中的作用。同时,解释了VC维在衡量模型复杂性中的应用,以及生成模型和判别模型的优缺点。文中还澄清了监督学习和无监督学习、判别式方法与生成式方法的区别,并指出KNN是判别式方法,K-means属于生成式方法。
摘要由CSDN通过智能技术生成

1.集成学习

将复杂任务分解成若干子任务,再综合若干子任务,从而完成复杂任务

2.支持向量机

通常用于分类,寻找样本的最大边距超平面

3.软间隔

软间隔,即容错,允许部分错分给定的训练样本

4.核函数

用于解决线性不可分的数据,将数据映射到更高的纬度,以达到线性可分的目的

ea4ef4160f564fd3a7032dac91271316.jpg

 

 

5.VC维

用来衡量模型的复杂性,VC维越高,模型越复杂

6.生成模型

通过对观察和标注数据计算联合概率分布来预测结果,相当于通过刷题掌握相应的知识,然后达到应付考试的目的

7.判别模型

通过求解条件概率分布或者直接计算来预测结果,相当于疯狂的背题刷题,不去理解,然后达到应付考试的目的。

8.生成式模型和判别式模型优缺点

生成式模型优点

①可以学习数据的概率分布

②对数据的结构和关系有更深入的理解

生成式模型的缺点

①如果对数据的理解错误,可能会产生大量错误

判别式模型优点

①预测性能较好

②计算效率较高

判别式模型的缺点

①对未知数据的预测效果不好

9.监督学习是判别式方法,无监督学习是生成式方法?

不正确,监督学习和无监督学习描述的是学习任务的类型,生成式方法和判别式方法描述的是模型的学习方式。

10.分类是判别式方法,聚类是生成式方法?KNN,K-means分别是什么方法?

不正确,理解有监督和无监督应该从模型需不需要标签的角度出发,就是模型关不关注标签的问题。模型不关注标签那就是无监督,反之有监督。这个问题实际上说的是模型的目的性问题。标签实际上是输出,数据实际上是输入。所以,如果模型的目的是要解决输入到输出的映射,那么标签实际上就是必要的,因为这是衡量模型准确性的依据,所以这个模型就是有监督的。反之,如果模型不关注输入到输出的映射,只关注数据本身,模型的目的就是提取数据本身的特征,那么它自然不需要标签。所以这就是聚类算法和分类算法本质的区别。分类算法实际上关注的是输入到输出的映射,而聚类算法则是对数据本身特征进行提取,相似特征的被聚到一类。

KNN判别式方法,kmeans生成式方法。

 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值