西瓜书
文章平均质量分 90
20斤芹菜肉包子
这个作者很懒,什么都没留下…
展开
-
【西瓜书笔记】——第二章:模型评估与选择
经验误差与过拟合错误率:分类错误的样本数占样本总数的比例 精度:精度=1-错误率误差:学习器的实际预测输出与样本的真是输出之间的差异 其中: 训练误差或经验误差:指的是学习器在训练集上的误差 泛化误差:指的是学习器在新样本上的误差因此,我们希望得到泛化误差小的学习器,但在事先不知道新样本是什么样的情况下智能努力使经验误差最小化。为了达到该目的,应该从训练样本中尽可能学出适用于所...原创 2018-10-14 22:48:07 · 854 阅读 · 1 评论 -
【西瓜书笔记】——第一章:绪论
第一章:绪论 06/09/18基础名词模型(Model):计算机通过数据训练所学习的结果。 数据集(Data Set):记录的集合。 示例(Instancce)或样本(Sample):每条记录是关于一个事件或对象的描述。 属性(Attribute)或特征(Feature):反映事件或对象在某方面的表现或性质的事项。 属性值(Attribute Value):属性上的取值。 ...原创 2018-09-16 05:22:08 · 243 阅读 · 0 评论 -
【西瓜书笔记】——第四章:决策树
本章对应于周志华——《机器学习》书本P73页,第四章:决策树。【引言】决策树是基于树结构来进行决策的,可以类比于常见的if条件语句。一般对于二分类,其判断过程就被称为“决策”或“判定”的过程。而前一轮的决策结果便是下一轮的必然前提,最终的决策结论对应了我们所希望的判定结果。1、基本流程【概念】:一颗决策树包含一个根结点、若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点则对应...原创 2018-09-29 03:27:05 · 1034 阅读 · 0 评论 -
【西瓜书笔记】——第三章:线性模型
1、基本形式定义:最简单的线性函数为:f(x)=wx+bf(x) = wx + bf(x)=wx+b将其扩展为矩阵形式,其中xi=(xi1,xi2,xi3,…,xij)Tx_i=(x_{i1},x_{i2},x_{i3}, …, x_{ij})^Txi=(xi1,xi2,xi3,…,xij)T表示对于单个样本xi,它拥有j个不同的特征,而针对每个特征的重要度不同,自然有权重矩阵:...原创 2018-09-23 22:18:59 · 841 阅读 · 0 评论 -
【西瓜书笔记】——神经网络
本文对应周志华——《机器学习》第五章·神经网络1、神经元模型神经网络是由具有适应性的简单单元组成的广泛并行互联的网络,它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应。神经元模型:是神经网络最基本的成分。当通过神经元的信息信好超过某一个阈值,那么该神经元就会激活,从而作用于下一个神经元。M-P神经元模型:神经元连接来自收到来自n个其他神经元传递来的输入信号,与权重结合进行传递。...原创 2018-10-14 22:48:19 · 2424 阅读 · 0 评论 -
【西瓜书笔记】——支持向量机(SVM)
【引言】支持向量机可作回归也可作分类,其主要思想是旨在建立一个WX+b的超平面,对高维样本空间进行数据拟合或划分。支持向量机的核心内容为核函数和凸优化问题,意在寻找合适的参数矩阵W和位移项b从而找到最合适的支持向量机。1、间隔与支持向量分类学习最基本的想法是基于训练集D在样本空间中找到一个划分超平面,将不同类别的样本分开。但是同一个样本空间中划分超平面有许多,而支持向量机就是旨在寻找最优的...原创 2018-10-17 02:40:51 · 738 阅读 · 0 评论