《机器学习》
文章平均质量分 91
以周志华《机器学习》教材为主线,博客系列提供学习辅导。
人工干智能
IT行业的一头老黄牛!你说牛不牛!牛!
展开
-
(《机器学习》完整版系列)第14章 概率图模型——14.3 条件随机场(链式CRF的条件概率)
联合概率可分解为条件概率的连乘,若每个因子都是同底的指数形式,则可转化为指数相加,由此引导我们对模型提出有利于计算的假设。通过团的分解及团上的势函数定义概率,而团的势可以定义成同底的指数形式。原创 2023-03-21 09:04:54 · 93 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第16章
周志华西瓜书《机器学习》习题提示——第16章原创 2023-07-24 15:51:31 · 225 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第15章
周志华西瓜书《机器学习》习题提示——第15章原创 2023-07-24 14:50:26 · 186 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第14章
周志华西瓜书《机器学习》习题提示——第14章原创 2023-07-24 13:12:14 · 359 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第13章
周志华西瓜书《机器学习》习题提示——第13章原创 2023-07-24 11:57:21 · 199 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第12章
周志华西瓜书《机器学习》习题提示——第12章原创 2023-07-23 18:06:27 · 242 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第11章
周志华西瓜书《机器学习》习题提示——第11章原创 2023-07-23 17:11:09 · 325 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第10章
周志华西瓜书《机器学习》习题提示——第10章原创 2023-07-23 16:09:50 · 350 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第9章
周志华西瓜书《机器学习》习题提示——第9章原创 2023-07-23 15:27:35 · 772 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第8章
周志华西瓜书《机器学习》习题提示——第8章原创 2023-07-23 11:48:43 · 527 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第7章
周志华西瓜书《机器学习》习题提示——第7章原创 2023-07-23 10:59:41 · 524 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第6章
周志华西瓜书《机器学习》习题提示——第6章原创 2023-07-22 16:02:32 · 747 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第5章
周志华西瓜书《机器学习》习题提示——第5章原创 2023-07-22 15:32:47 · 442 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第4章
周志华西瓜书《机器学习》习题提示——第4章原创 2023-07-22 11:54:38 · 429 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第3章
周志华西瓜书《机器学习》习题提示——第3章原创 2023-07-22 10:44:32 · 230 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第2章
周志华西瓜书《机器学习》习题提示——第2章原创 2023-07-21 17:33:12 · 221 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第1章
周志华西瓜书《机器学习》习题提示——第1章原创 2023-07-21 16:36:07 · 171 阅读 · 0 评论 -
(《机器学习》完整版系列)第5章 神经网络——5.4 BP算法的高级表达(简洁之美)
对数学成绩好的同学,可以学习BP算法的高级表达,即由向量和矩阵表达BP算法中的公式。原创 2023-04-12 16:40:19 · 255 阅读 · 1 评论 -
(《机器学习》完整版系列)附录 ——8、协方差矩阵的特征值
由于求协方差矩阵的特征值在机器学习中具有非常重要的地位,为此,我们专讨论它。原创 2023-03-16 11:32:33 · 1094 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——7、有趣的距离与范数(距离是两点之间的,如果将一个点固定在原点,则为向量的范数)
聚类的相似度通常用距离来刻划,距离又分为“(度量)距离”和“非度量距离”,“度量距离”由四条基本性质而“非度量距离”少满足一条(即不满足直递性)。距离是两点之间的(公式中含有这两点的坐标),如果我们将一个点固定在原点,则相应公式就变为只含一个点(向量)了,称为向量的范数。原创 2023-03-02 09:07:14 · 215 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——6、指示函数及应用(将分段函数表达成一个式子的技术)
指示函数是将分段函数表达成一个式子的技术原创 2023-02-27 17:28:36 · 509 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——5、含矩阵的偏导数
讨论了如下含矩阵的偏导数:迹的偏导数偏导数中的“分子”为标量,“分母”为矩阵偏导数中的“分子”为矩阵,“分母”为标量偏导数中的“分子”“分母”均为矩阵(或一矩阵一向量)原创 2023-02-27 13:01:54 · 307 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——4、神经网络中的梯度(链式法则的图形助记)
神经网络中,图形常以“层”体现,“层”中的参数对应为一“组”(向量),而神经网络的逆向传播算法就是梯度的链式法则所体现的传播特点,这里我们再从这一角度来讨论梯度。复合函数梯度的链式法则式(A58)、式(A59)的图形助记。原创 2023-02-27 12:12:36 · 309 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——3、复合函数梯度的链式法则(链的次序不可交换)
推导了复合函数梯度的链式法统一形式。首创了的链式记号,非常易记:分子右挪+分数约分,特别是它强调了链的表达次序,由于矩阵积没有交换律,故该链的次序不可交换。注:修正了一般教材中的错误次序(在标量时正确)原创 2023-02-27 11:32:34 · 1281 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——2、偏导数与梯度(以矩阵的整体形式表述)
把一组偏导数公式以矩阵的整体形式表述首创地引入形象化的记号式(A44)和式(A45),易记易写原创 2023-02-27 11:13:42 · 246 阅读 · 0 评论 -
(《机器学习》完整版系列)附录 ——1、向量与矩阵(学习一些公式及其推导技巧)
机器学习特别是深度学习,常常用到偏导数和梯度,一些公式的推导需要用到较深的数学知识,为方便进一步深造的同学学习,这里我们结合【西瓜书附录第A.2节的导数】学习一些公式和推导技巧。原创 2023-02-27 10:55:17 · 271 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.12 逆强化学习(逆是指回到条件中)
现在,强化学习任务的条件中,奖赏函数未知,用线性函数(近似地)表达奖赏函数(其参数未知)。逆强化学习是指学习的内容是强化学习任务某条件。基于“人类专家具有最优性”这一假定,以及多目标优化理论,交替地迭代出最优奖赏函数。原创 2023-03-28 09:14:04 · 616 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.11 直接模仿学习
借助人类专家曾经的决策轨迹数据,进行模仿学习是一个很好的思路,特别是可作为初始化手段。广泛收集人类专家在该任务中,形成的数据集。 这样,就可以用分类(离散时)或回归(连续时)算法学习出一个确定性的策略,再以此为基础就可以学习出一个概率性策略。原创 2023-03-28 08:50:51 · 169 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.10 值函数近似
函数近似:以某种已知曲线(含参数)逼近未知函数。现在:未知函数为 值函数,已知函数取线性函数原创 2023-03-28 08:36:13 · 190 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.9 时序差分学习(Sara算法与Q-学习算法)
前述蒙特卡罗试验并没有限定轨线长度,现在把焦点放在最短轨线上:新增一步蒙特卡罗试验产生的长度为1的轨线。由于取长度为1的蒙特卡罗试验轨线(单步),即可更新一次,不再需要计数变量原创 2023-03-27 17:31:12 · 264 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.8 异策略蒙特卡罗强化学习算法(换分布)
通过换分布进行蒙特卡罗试验(采样)来实现。求期望时“换分布”的想法及公式,有点像求对数时的“换底”原创 2023-03-27 17:05:19 · 272 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.7 同策略蒙特卡罗强化学习
自由地执行一次长度为TT蒙特卡罗试验(并不限定起点),就可以依迭代式对该试验轨线上所有点作一次更新,依结果,对策略进行一次优化。将ϵ-贪心算法修改为同策略蒙特卡罗强化学习算法原创 2023-03-27 16:43:05 · 137 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.6 策略迭代与值迭代算法
将策略改进序列算法化,则分别得到策略迭代与值迭代算法。原创 2023-03-27 11:54:17 · 164 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.5 策略改进(单调递增有界序列必收敛)
有模型策略估值算法可得到所有状态在给定策略下的值,这样就可以对多个策略进行比较选优,不断地调整策略,使其达到最优。方法:构造出“勉强”的单调递增有界序列(对应策略序列),利用单调递增有界序列必收敛的定理进行推导。原创 2023-03-27 11:36:45 · 110 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.4 有模型策略估值算法
已知策略,计算执行该策略获得的(平均)奖赏,即是策略估值,本篇利用Bellman等式【西瓜书式(16.7)(16.8)】进行策略估值。原创 2023-03-27 10:51:22 · 113 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.3 有模型的迭代式的详细推导(并更正一些错误思路)
本篇详细推导出值函数的递归等式,称为贝尔曼方程(Bellman等式)。原创 2023-03-27 10:15:06 · 153 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.2 K-摇劈赌博机的贪心算法(赌博当然贪心)
赌博当然贪心,所以有贪心算法。常常面临“探索-利用”窘境,贪心算法即是在二者间进行概率分配。原创 2023-03-27 08:27:44 · 239 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.1 任务与奖赏(从MDP出发)
在马尔可夫决策过程中,“两阶段模型”是笔者独创的模型图,非常有利于教与学。定义了γ折扣累积奖赏与T步累积奖赏原创 2023-03-26 09:21:15 · 234 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.11 基于逆归结的机器证明
把求证问题转化成一个子句集:将条件“分拆”为析取式,并加入结论的否定式,利用置换和消解得到消解式,将消解式放入子句集中,但并不删除子句,继续消解直至得到空子句,从而得证。原创 2023-03-25 22:25:45 · 148 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.10 归纳逻辑程序设计之逆归结
在命题逻辑中我们讨论了归结与逆归结,这里我们将其推广到一阶逻辑中一阶逻辑的归结、逆归结通常用到“置换”和“合一”操作逆结归的特点之一就是能自动发明新谓词,但新谓词的语义需要领域知识进行理解原创 2023-03-25 22:09:08 · 363 阅读 · 0 评论