机器学习
Philia_YF
这个作者很懒,什么都没留下…
展开
-
机器学习(西瓜书)第十章笔记
Note:我们学习过程中第十章并不是重点,所以并没有做很详细的笔记k近邻学习k近邻学习是一种常用的监督学习方法工作机制:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练样本,然后基于这k 个“邻居”的信息来进行预测通常,在分类任务中可使用“投票法” ,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可使用“平均法”,即将这k个样本的实值输出标记的平...原创 2019-12-31 09:52:37 · 2459 阅读 · 0 评论 -
机器学习(西瓜书)第九章笔记
该博客是在一篇博主的基础上该的,如果要看详细的,可以参考他的博客:https://blog.csdn.net/shichensuyu/article/details/94552906聚类的应用生物进化树寻找优质客户推荐系统信用卡照片黑客攻击聚类和分类的区别聚类没有学习集,告诉我这些样本点如何去分类,无监督学习分类:有监督学习什么样的聚类结果比较好呢...原创 2019-12-31 09:51:06 · 893 阅读 · 0 评论 -
机器学习(西瓜书)第七章笔记
极大似然估计这种参数估计方法虽能使类条件概率估计变得相对简单,但是结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。Laplacian correction避免了因训练集样本不充分而导致概率估值为零的问题,并且在训练集变大时,修正过程所引入的先验的影响也会逐渐变得可忽略,使得估值渐渐趋向于实际概率值。贝叶斯分类中后验概率P(c|x)的求解确实很困难,于是提出...原创 2019-12-31 09:43:56 · 1476 阅读 · 0 评论 -
机器学习(西瓜书)第六章笔记
如果能找到一个超平面,把二分类问题分隔开,则采用拉格朗日结合KKT条件求解该问题如果不存在这样的超平面可以正确划分该怎么办?将样本从原始空间映射到一个更高维空间,使得样本在这个特征空间内线性可分,计算过程就是将样本x换成一个向量µ(x)习题答案:4.讨论线性判别分析与线性核支持向量机在何种情况下等价。在线性可分的情况下,LDA求出的wlwl与线性核支持向量机求出的wsws...原创 2019-12-31 09:42:57 · 1183 阅读 · 0 评论 -
机器学习(西瓜书)第五章学习笔记
标准BP算法和累积BP算法的比较标准BP算法每次只针对单个样例,参数更新得非常频繁,而且对不同样例进行更新的效果可能出现“抵消”现象。因此,为了达到同样的累积误差极小点,标准BP算法往往需要进行更多次数的迭代累积BP算法:直接针对累计误差最小化,它在读取整个训练集D一遍后才对参数进行更新,这样参数更新得频率就会小很多,但是同...原创 2019-12-31 09:41:35 · 2438 阅读 · 0 评论 -
机器学习(西瓜书)第四章笔记
Part1 名词解释 一棵决策树包含一个根节点,若干个内部节点和若干个叶节点,叶节点对应决策结果,其他每个节点测对应于一个属性测试,每个结点包含的样本集合根据属性测试的结果被划分到子结点中,根结点包含样本全集,从根节点到每个叶节点的路径对应了一个判别测试序列。 决策树学习的目的是为了产生一颗泛化能力强,及处理未见示例能力强的决策树,其基本流程遵循简单且直观的“分而治之...原创 2019-12-31 09:32:23 · 604 阅读 · 0 评论 -
机器学习(西瓜书)第三章笔记
Part5关于多分类学习 以上两种方法可以从存储开销和训练时间两个角度来分析模型的优势。海明距离:就是比较测试实例中与上面的每一行不同的个数欧式距离:以测试集和第一行为例,sqrt[(1-(-1))2+(-1-1))2+(1-(-1))2]=sqrt(12)关于习题答案习题3.1:试分析在什么情况下,在以下式子中不比考虑偏置项b线性模型y...原创 2019-12-31 09:31:21 · 1901 阅读 · 0 评论 -
机器学习(西瓜书)第二章
该笔记是在学习周志华老师《机器学习》这本书的过程中所做的笔记Part1 经验误差与过拟合精确度=1-错误率泛化误差:在新样本上的误差过拟合:学习器把训练样本学得太好了,很可能已经把训练样本自身的一些特点当作了所有潜在样本都具有的一般性质,这样会导致泛化能力下降产生过拟合的原因:学习能力太强了欠拟合:对训练样本的一般性质尚未学好欠拟合产生的原因:学习能力低下...原创 2019-12-31 09:30:02 · 990 阅读 · 0 评论 -
机器学习(西瓜书)第一章学习笔记
Part1 名词解释训练过程中使用的数据集称为训练集,其中的每一个样本称为训练样本。测试:学得模型后,使用该模型进行预测的过程,被预测的样本成为测试样本假设:学得模型对应于数据的某种潜在规律,这种潜在的规律自身成为真相或真实学习的过程就是为了找出或逼近真相,将这种模型成为学习器样例:拥有标记信息的示例分类:预测的是离散值,则称分类回归:预测的是连续纸,则称回归...原创 2019-12-31 09:24:40 · 396 阅读 · 0 评论