机器学习西瓜书
机器学习西瓜书阅读笔记
kurok_
很懒的coder
展开
-
机器学习-频率派vs贝叶斯派
参考视频:【机器学习】【白板推导系列】【合集 1~33】_哔哩哔哩_bilibili转载 2022-07-13 17:39:34 · 107 阅读 · 0 评论 -
西瓜书第三章-线性模型
给定m个样本{Xi}i=1...m,每个Xi由d个属性描述,整体样本为一个m*d的矩阵,每个样本有一个真实值yi,yi=wXi+bi,我们要求的就是对应的w和和bi。w为1*d大小,Xi为d*1大小,bi为1*1大小。拓展:若每个样本的真实值是一个向量,假如说是n维的向量,那yi=wXi+bi中,w为n*d大小,Xi为d*1大小,bi为n*1大小。(多因变量的多元线性回归)为了找到尽可能符合 上面等式的w和b,可以定义一个损失函数,然后让损失函数最小化即可,损失函数可以定义为预测值和真实值的均方误差,然后进原创 2022-07-13 17:36:23 · 366 阅读 · 0 评论 -
西瓜书第二章-比较检验
有了实验评估方法和性能度量,看似就可以比较不同方法的效果了,但是这是不严谨的。首先我们希望比较的是泛化性能,可能与测试集上的结果不同,这就需要用到统计假设检验,基于假设检验结果我们可推断出,若在测试集上观察到学习器A比B好,则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大。以下介绍两种最基本的假设检验,为便于讨论,本节默认使用错误率为性能度量。很多时候要经过多次留出法或者交叉验证法进行多次训练/测试,这样就会有多个测试错误率。假设得到了k个测试错误率,1~k,平均错误率和方差可求出 可以使用T原创 2022-07-09 17:40:44 · 442 阅读 · 0 评论 -
西瓜书第二章笔记-评估方法
机器学习西瓜书第二章-评估方法原创 2022-07-09 13:54:19 · 168 阅读 · 0 评论 -
西瓜书第二章笔记-性能度量
本篇只讨论预测任务的度量方法。回归任务中常用的是均方误差:更一般的,对于数据分布D和概率密度函数p(),均方误差可以表示为错误率:分类错误的样本站样本总数的比例精度:1-错误率同样有概率分布形式,与回归任务类似。真正例(TP)、假正例(FP)、真反例(TN)、假反例(FN)查准率P=TP/(TP+FP),判断的正例中,真是正例的比例查全率R=TP/(TP+FN),所有正例中,被判断为真的比例P-R曲线,可大致判断哪个模型好,一般如果A能全包B则说明A好,但是这种情况很少,可以比较面积,也可以比较平衡点(BE原创 2022-07-09 14:30:20 · 136 阅读 · 0 评论