机器学习
中南大学智能控制与优化决策实验室
这个作者很懒,什么都没留下…
展开
-
第十一章 特征选择
1、简述特征选择的目的。 特征选择是一个重要的“数据预处理”过程,在现实机器学习任务中,获得数据之后通常先进行特征选择,此后再训练学习机器。我们进行特征选择主要有以下两个重要目的: 减轻维数灾难 我们在现实任务中经常会遇到维数灾难问题,这是由于属性过多而造成的,若能从中选择出重要的特征,使得后续学习过程仅需在一部分特征上构建模型,则维数灾难问题会大为减轻。从这个意义上来说,特征选择与第十章介绍的降维有相似的动机。 降低学习任务的难度 去除不相关的特征往往会降低学习任务的难度,这就像侦探破案一样,若将纷原创 2020-06-26 19:16:55 · 1462 阅读 · 0 评论 -
第七章 贝叶斯分类器
1. 解释先验概率、后验概率、全概率公式、条件概率公式,结合实例说明贝叶斯公式,如何理解贝叶斯定理? 先验概率 先验概率P(c)P(c)P(c)表达了样本空间各类样本所占的比例,根据大数定律,当训练集包含充足的独立分布的样本时,P(c)P(c)P(c)可通过各类样本出现的频率来进行估计。 后验概率 后延概率P(c∣x)P(c|x)P(c∣x),可以理解为在类别ccc在训练集xxx下所谓的“真实出现的概率” 全概率公式 如图所示,一个样本空间 SSS 被 B1,B2...B6B_1,B_2...B_原创 2020-06-26 19:13:59 · 289 阅读 · 0 评论 -
第八章 集成学习
1. 谈谈集成学习的概念和思想。 集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system) 、基于委员会的学习(committee-based learning) 等. 集成学习的示意图如下所示: 它的主要思想是通过将多个学习器进行结合,常可获得比单一学习器显著优越的泛化性能。由于基学习器的误差相互独立. 在现实任务中,个体学习器是为解决同一个问题训练出来的,它们显然不可能相互独立! 事实上,个体学习器的原创 2020-06-25 22:38:26 · 752 阅读 · 0 评论 -
第五章 神经网络
1. 试述常见的激活函数,试述将线性函数 f(x)=wTxf(x)=w^Txf(x)=wTx 用作神经元激活函数的缺陷 1.1什么是激活函数 如下图,如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数 Activation Function. 1.2激活函数的作用 如果不用激励函数,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这也是为什么不使用线性激活函数的原因。 如果使用的话,激活函数给神经元引入了非线性因素,使得神经原创 2020-06-26 19:21:45 · 936 阅读 · 0 评论 -
第四章 决策树
决策树学习算法包括哪几个部分?常用的算法有哪些? 决策树的学习算法主要包括三个部分: 1.特征选择 2.树的生成 3.树的剪枝 常用的算法有以下几种: 1.ID3 2. C4.5 3.CART 决策树的根节点、内部节点和叶节点分别表示什么? 叶结点对应于决策结果,其他每个结点则对应于一个属性测试;每个结点包含的样本样本集合根据属性测试的结果被划分到子结点中;根结点包含样本全集.从根结点到每个叶结点的路径对应了一个判定测试序列. 特征选择的准则有哪些(如何选择最优划分属性)? 主要是根据信息增益原创 2020-06-26 19:25:17 · 639 阅读 · 0 评论