机器学习
分享学习交流《机器学习-周志华》的一些内容吧!
山东大学-苏苏
小白一个,互相交流。
展开
-
山东大学 机器学习 K-means实验
K-means算法设计与实现编程语言C,C++,Java或者学过的其它编程语言实验数据介绍红酒数据集(Wine Data Set)http://archive.ics.uci.edu/ml/datasets/Wine共178个数据,每个数据特征为13维13个特征分别为:(13个化学成分,每个成分取值为实数)1) Alcohol2) Malic acid3) ...原创 2020-01-17 15:34:09 · 1330 阅读 · 0 评论 -
山东大学 机器学习 决策树实验
决策树实验实验任务:实现ID3决策树,并在给定的数据集上进行5折交叉验证。并观测训所得到的决策树在训练集和测试集的准确率,从而判断该决策树是否存在过拟合。在此基础上实现预剪枝和后剪枝,并比较预剪枝树与后剪枝树在训练集和测试集上的准确率。编程语言:java, matlab, python, C++,C均可数据集:鸢尾花卉Iris数据集描述:iris是鸢尾植物,这里存储了...原创 2020-01-17 15:26:58 · 1117 阅读 · 0 评论 -
山东大学 机器学习 贝叶斯实验
实验一:“贝叶斯分类器的设计”实验说明Part 1.仿真实验随机产生10000组正样本和20000负样本高斯分布的数据集合(维数设为二维),要求正样本:均值为[1;3],方差为[20;02];负样本:均值为[10;20],方差为[100;010]。先验概率按样本量设定为1/3和2/3.分别利用最小错误概率贝叶斯分类器和最小风险概率贝叶斯分类器对其分类。(假设风险程度正样本分错风险系...原创 2020-01-17 15:14:13 · 1682 阅读 · 0 评论 -
机器学习(周志华)第一章课后答案
写在前面:这学期开始学习机器学习,后面给出的问题的解答或是想法仅供参考,甚至还有错误的地方,届时希望大能们能够加以斧正,解答我的疑惑。1.1首先课本给出的样例的版本空间是错的,害我一脸懵逼(再版的已经更正了)。正确应为:若只包含样例1和4,则“色泽”“根蒂”“敲声”分别都有2中取值,所以假设空间规模大小为3*3*3+1=28种。版本空间为:A(2,2)-1 = 7...原创 2019-09-17 20:49:04 · 3264 阅读 · 0 评论 -
机器学习(周志华)如何理解ROC曲线的绘制过程并证明排序损失等于ROC曲线上的面积
课本给出对于排序损失的定义后,并没有详细论述为何就等同于ROC曲线上的面积,希望下面的内容对你理解这部分有所帮助!如何理解描绘的过程呢?用m+个正例与m-反例,由于将分类阈值依次设为每个样本的预测值,即每次都猜测为正例,因此结果不是真正例就是假正例。若为真正例,则上移1/m+单位;若为假正例,则右移1/m-单位。这样恰恰说明了为什么横轴就表示FPR,纵轴就表示TPR。...原创 2019-09-20 17:21:50 · 3427 阅读 · 2 评论