西瓜书《机器学习》汇总
文章平均质量分 96
MCMer
写点东西和大家分享
展开
-
西瓜书学习笔记---第四章 决策树
西瓜书学习笔记--第四章 决策树4.3编程实现基于信息熵进行划分选择的决策树算法,并为西瓜数据集3.0中的数据生成一颗决策树。4.4编程实现基于基尼指数进行划分选择的决策树算法,为西瓜数据集2.0生成预剪枝、后剪枝决策树,并与未剪枝决策树进行比较。4.6选择4个UCI数据集,对上述2种算法产生的未剪枝,预剪枝,后剪枝的决策树进行实验比较,并进行适当的统计显著性检验。.........原创 2022-06-21 17:12:44 · 5647 阅读 · 3 评论 -
西瓜书学习笔记---第三章 线性模型
一、题目要求3.3 编程实现对率回归,并给出西瓜数据集3.0α上的结果3.4选择两个 UCI 数据集,比较 10 折交叉验证法和留一法所估计出的对率回归的错误率。3.5编辑实现线性判别分析,并给出西瓜数据集 3.0α 上的结果.原创 2022-03-08 16:29:48 · 2183 阅读 · 1 评论 -
西瓜书学习笔记---第二章 模型评估与选择
一、题目要求选取某UCI分类数据集,划分数据集,用10折交叉验证,选用两个现成的分类算法(或者一个算法、参数不同),得到分类模型A和B,给出交叉验证预测结果。 对两模型的交叉验证预测结果,分别给出混淆矩阵、P、R和F1值,作出P-R曲线、ROC曲线,并求AUC。 应用paired t-test假设检验,比较两个模型性能的优劣。二、数据集介绍选用的数据集为UCI分类数据集中的糖尿病“Diabetes”数据集,数据集共包含768条信息,每条信息对应一位可能患有糖尿病的患者的8个属性,并给出.原创 2022-03-07 21:48:12 · 1889 阅读 · 4 评论