机器学习
EVAO
这个作者很懒,什么都没留下…
展开
-
周志华-机器学习-第四章(决策树)-笔记+习题答案
笔记1.基本流程2.划分选择信息增益假定当前样本集合D中第K类样本所占的比例为 Pk (k = 1, 2,. . . , IYI) ,则D的信息熵定义为信息增益为:信息增益准则对可取值数目较多的属性有所偏好。增益率为减少这种偏好可能带来的不利影响,使用"增益率",表达式如下:需注意的是,增益率准则对可取值数目较少的属性有所偏好?因此 C4.5 算法并不是直接选择增益率最...原创 2019-12-05 14:52:14 · 2071 阅读 · 0 评论 -
周志华-机器学习-第一章-笔记+习题答案
1.1 表1. 1中若只包含编号为 1和4的两个样例?试给出相应的版本空间.P5:与训练集一致的“假设集合”我们称之为版本空间。本题即在假设空间中搜索包含正例且不包含反例的所有假设。(详细说明见后思考)首先,用一个六位二进制数将整个假设空间表示出来,每两位描述一个属性。前两位取01表示色泽的取值为“青绿”,10表示色泽取值为“乌黑”,11表示色泽取值为 。后四位分别表示根蒂与敲声的取值,以此类...原创 2019-09-12 13:35:17 · 15584 阅读 · 4 评论 -
周志华-机器学习-第二章(模型评估与选择)-笔记+习题答案
笔记1.评估方法1.留出法直接将数据集D 划分为两个互斥的集合,其中一个集合作为训练集 S,另一个作为测试集T,即 ,在 S上训练出模型后,用 T来评估其测试误差,作为对泛化误差的估计.2.交叉验证法将数据 D分为 k个大小相似的互斥子集,3.自助法给定包含 m个样本的数据集 D我们对它进行采样产生数据集 D'2.性能度量1.错误率与精度2.查准率、查全率与F13.代...原创 2019-09-18 16:43:34 · 3201 阅读 · 0 评论