周志华【西瓜书】辅导
文章平均质量分 91
本专栏用于发布原创的辅导《机器学习(周志华)》的博客。
人工干智能
IT行业的一头老黄牛!你说牛不牛!牛!
展开
-
周志华西瓜书《机器学习》习题提示——第16章
周志华西瓜书《机器学习》习题提示——第16章原创 2023-07-24 15:51:31 · 225 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第15章
周志华西瓜书《机器学习》习题提示——第15章原创 2023-07-24 14:50:26 · 186 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第14章
周志华西瓜书《机器学习》习题提示——第14章原创 2023-07-24 13:12:14 · 359 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第13章
周志华西瓜书《机器学习》习题提示——第13章原创 2023-07-24 11:57:21 · 199 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第12章
周志华西瓜书《机器学习》习题提示——第12章原创 2023-07-23 18:06:27 · 242 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第11章
周志华西瓜书《机器学习》习题提示——第11章原创 2023-07-23 17:11:09 · 325 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第10章
周志华西瓜书《机器学习》习题提示——第10章原创 2023-07-23 16:09:50 · 350 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第9章
周志华西瓜书《机器学习》习题提示——第9章原创 2023-07-23 15:27:35 · 772 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第8章
周志华西瓜书《机器学习》习题提示——第8章原创 2023-07-23 11:48:43 · 527 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第7章
周志华西瓜书《机器学习》习题提示——第7章原创 2023-07-23 10:59:41 · 524 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第6章
周志华西瓜书《机器学习》习题提示——第6章原创 2023-07-22 16:02:32 · 747 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第5章
周志华西瓜书《机器学习》习题提示——第5章原创 2023-07-22 15:32:47 · 442 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第4章
周志华西瓜书《机器学习》习题提示——第4章原创 2023-07-22 11:54:38 · 429 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第3章
周志华西瓜书《机器学习》习题提示——第3章原创 2023-07-22 10:44:32 · 230 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第2章
周志华西瓜书《机器学习》习题提示——第2章原创 2023-07-21 17:33:12 · 221 阅读 · 0 评论 -
周志华西瓜书《机器学习》习题提示——第1章
周志华西瓜书《机器学习》习题提示——第1章原创 2023-07-21 16:36:07 · 171 阅读 · 0 评论 -
(《机器学习》完整版系列)第5章 神经网络——5.4 BP算法的高级表达(简洁之美)
对数学成绩好的同学,可以学习BP算法的高级表达,即由向量和矩阵表达BP算法中的公式。原创 2023-04-12 16:40:19 · 255 阅读 · 1 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.12 逆强化学习(逆是指回到条件中)
现在,强化学习任务的条件中,奖赏函数未知,用线性函数(近似地)表达奖赏函数(其参数未知)。逆强化学习是指学习的内容是强化学习任务某条件。基于“人类专家具有最优性”这一假定,以及多目标优化理论,交替地迭代出最优奖赏函数。原创 2023-03-28 09:14:04 · 616 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.11 直接模仿学习
借助人类专家曾经的决策轨迹数据,进行模仿学习是一个很好的思路,特别是可作为初始化手段。广泛收集人类专家在该任务中,形成的数据集。 这样,就可以用分类(离散时)或回归(连续时)算法学习出一个确定性的策略,再以此为基础就可以学习出一个概率性策略。原创 2023-03-28 08:50:51 · 169 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.10 值函数近似
函数近似:以某种已知曲线(含参数)逼近未知函数。现在:未知函数为 值函数,已知函数取线性函数原创 2023-03-28 08:36:13 · 190 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.9 时序差分学习(Sara算法与Q-学习算法)
前述蒙特卡罗试验并没有限定轨线长度,现在把焦点放在最短轨线上:新增一步蒙特卡罗试验产生的长度为1的轨线。由于取长度为1的蒙特卡罗试验轨线(单步),即可更新一次,不再需要计数变量原创 2023-03-27 17:31:12 · 264 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.8 异策略蒙特卡罗强化学习算法(换分布)
通过换分布进行蒙特卡罗试验(采样)来实现。求期望时“换分布”的想法及公式,有点像求对数时的“换底”原创 2023-03-27 17:05:19 · 272 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.7 同策略蒙特卡罗强化学习
自由地执行一次长度为TT蒙特卡罗试验(并不限定起点),就可以依迭代式对该试验轨线上所有点作一次更新,依结果,对策略进行一次优化。将ϵ-贪心算法修改为同策略蒙特卡罗强化学习算法原创 2023-03-27 16:43:05 · 137 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.6 策略迭代与值迭代算法
将策略改进序列算法化,则分别得到策略迭代与值迭代算法。原创 2023-03-27 11:54:17 · 164 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.5 策略改进(单调递增有界序列必收敛)
有模型策略估值算法可得到所有状态在给定策略下的值,这样就可以对多个策略进行比较选优,不断地调整策略,使其达到最优。方法:构造出“勉强”的单调递增有界序列(对应策略序列),利用单调递增有界序列必收敛的定理进行推导。原创 2023-03-27 11:36:45 · 110 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.4 有模型策略估值算法
已知策略,计算执行该策略获得的(平均)奖赏,即是策略估值,本篇利用Bellman等式【西瓜书式(16.7)(16.8)】进行策略估值。原创 2023-03-27 10:51:22 · 113 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.3 有模型的迭代式的详细推导(并更正一些错误思路)
本篇详细推导出值函数的递归等式,称为贝尔曼方程(Bellman等式)。原创 2023-03-27 10:15:06 · 153 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.2 K-摇劈赌博机的贪心算法(赌博当然贪心)
赌博当然贪心,所以有贪心算法。常常面临“探索-利用”窘境,贪心算法即是在二者间进行概率分配。原创 2023-03-27 08:27:44 · 239 阅读 · 0 评论 -
(《机器学习》完整版系列)第16章 强化学习——16.1 任务与奖赏(从MDP出发)
在马尔可夫决策过程中,“两阶段模型”是笔者独创的模型图,非常有利于教与学。定义了γ折扣累积奖赏与T步累积奖赏原创 2023-03-26 09:21:15 · 234 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.11 基于逆归结的机器证明
把求证问题转化成一个子句集:将条件“分拆”为析取式,并加入结论的否定式,利用置换和消解得到消解式,将消解式放入子句集中,但并不删除子句,继续消解直至得到空子句,从而得证。原创 2023-03-25 22:25:45 · 148 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.10 归纳逻辑程序设计之逆归结
在命题逻辑中我们讨论了归结与逆归结,这里我们将其推广到一阶逻辑中一阶逻辑的归结、逆归结通常用到“置换”和“合一”操作逆结归的特点之一就是能自动发明新谓词,但新谓词的语义需要领域知识进行理解原创 2023-03-25 22:09:08 · 363 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.9 归纳逻辑程序设计之最小一般泛化
完备性与一致性有四种组合泛化是具体化和实例化的反面,就是使其更一般化,从“多条具体事实(或规则)”中得到更一般化的“一条规则”,要求该规则不与这些事实矛盾或尽可能少矛盾。原创 2023-03-25 21:41:36 · 241 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.8 三种蕴涵(你会区分么?)
有三种蕴涵概念,需通过上下文区分。原创 2023-03-25 07:40:47 · 296 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.7 FOIL算法(找出含逻辑变量的公式)
将基于“属性值”的训练集调整为基于“属性值比较”的训练集。对样本集进行学习,就是设法找出含逻辑变量的公式(集)。原创 2023-03-25 07:17:41 · 412 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.6 一阶逻辑公式及“分拆”
一阶逻辑公式A与子句集S(命题规则)可相互转换。原创 2023-03-25 06:59:45 · 169 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.5 剪枝优化(预剪枝(阻止生长)和后剪枝(“由长变短”))
将规则的“由短变长”的过程看成是树枝生长过程,那么,对树就有剪枝,包括预剪枝(阻止生长)和后剪枝(“由长变短”)。剪枝过程涉及到规则的取舍,可以用统计显著性检验原创 2023-03-22 18:20:01 · 209 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.4 序贯覆盖(规则集与数据集)
在训练集中,学到一条规则后,将这条规则所覆盖的样例(满足规则的样例,或叫支持该规则的样例)全去掉,形成一个较小的训练集,再在其上进行规则学习,直至训练集为空,这就是序贯覆盖法。原创 2023-03-22 17:52:48 · 207 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.3 归结与逆归结(你可知“反证法”原理?)
归结原理(即消解):可以“消除”该互补项原创 2023-03-22 11:28:45 · 515 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.2 形式推理(哥德尔怎么说?)
平时我们说的“三段式”推理就是形式推理.命题逻辑体系具有可靠性和完备性,而规则又有利于机器实现,这就能实现机器自动化证明。 不幸的是,数学家哥德尔证明了不完全性定理:任何形式推理系统中总存在不能证真也不能证伪的命题。原创 2023-03-22 10:59:07 · 106 阅读 · 0 评论 -
(《机器学习》完整版系列)第15章 规则学习——15.1 命题规则(逻辑学、布尔表达)
以命题形式的规则表达,由“条件”得到“结论”。从集合论的角度来看,具有蕴涵(包含)关系。“条件”可能分解为若干“子条件”,需要它们同时成立。通过真值表可以定义语义。原创 2023-03-21 17:28:03 · 206 阅读 · 0 评论