学习笔记
文章平均质量分 81
编程路上的笔记
Tenora鸢栀
这个作者很懒,什么都没留下…
展开
-
机器学习_周志华_西瓜书_学习笔记_第16章--强化学习
16、强化学习 强化学习(Reinforcement Learning,简称RL)是机器学习的一个重要分支,前段时间人机大战的主角AlphaGo正是以强化学习为核心技术。在强化学习中,包含两种基本的元素:状态与动作,在某个状态下执行某种动作,这便是一种策略,学习器要做的就是通过不断地探索学习,从而获得一个好的策略。例如:在围棋中,一种落棋的局面就是一种状态,若能知道每种局面下的最优落子动作,那就攻无不克/百战不殆了~ 若将状态看作为属性,动作看作为标记,易知:监督学习和强化学习都是在试图寻找一个映射,从已知原创 2022-02-27 11:44:12 · 416 阅读 · 0 评论 -
机器学习_周志华_西瓜书_学习笔记_第三章--线性模型
笔记的前一部分主要是对机器学习预备知识的概括,包括机器学习的定义/术语、学习器性能的评估/度量以及比较,本篇之后将主要对具体的学习算法进行理解总结,本篇则主要是第3章的内容–线性模型。 3、线性模型 谈及线性模型,其实我们很早就已经与它打过交道,还记得高中数学必修3课本中那个顽皮的“最小二乘法”吗?这就是线性模型的经典算法之一:根据给定的(x,y)点对,求出一条与这些点拟合效果最好的直线y=ax+b,之前我们利用下面的公式便可以计算出拟合直线的系数a,b(3.1中给出了具体的计算过程),从而对于一个新的x,原创 2022-02-27 10:52:17 · 279 阅读 · 0 评论 -
机器学习_周志华_西瓜书_学习笔记_第二章--模型的评估与选择
2 模型的评估与选择 2.1 误差与过拟合 我们将学习器对样本的实际预测结果与样本的真实值之间的差异成为:误差(error)。定义: 在训练集上的误差称为训练误差(training error)或经验误差(empirical error)。 在测试集上的误差称为测试误差(test error)。 学习器在所有新样本上的误差称为泛化误差(generalization error)。 显然,我们希望得到的是在新样本上表现得很好的学习器,即泛化误差小的学习器。因此,我们应该让学习器尽可能地从训练集中学出普适原创 2022-02-27 10:50:56 · 691 阅读 · 0 评论 -
机器学习_周志华_西瓜书_学习笔记_第一章
绪论 1.1引言 以计算的手段利用经验(数据)来改善系统自身性能。在计算机上面从数据中产生模型,我们提供经验数据,基于经验和数据产生模型,面对新的情况模型会给我们相应的判断。 另一本经典教材的作者Mitchell给出了一个形式化的定义,假设: P:计算机程序在某任务类T上的性能。 T:计算机程序希望实现的任务类。 E:表示经验,即历史的数据集。 若该计算机程序通过利用经验E在任务T上获得了性能P的改善,则称该程序对E进行了学习。 1.2基本术语 1.2.1术语原创 2022-02-27 10:20:37 · 591 阅读 · 0 评论