周志华【西瓜书】辅导_人工干智能的博客-CSDN博客

周志华【西瓜书】辅导

关注

文章平均质量分 91

本专栏用于发布原创的辅导《机器学习（周志华）》的博客。

关注数：文章数：143 文章阅读量：76337 文章收藏量：256

作者: 人工干智能

IT行业的老黄牛！文章见！不吹牛！能帮你解决技术问题，请直接15013038985（微信同号）

展开

专栏收录文章

周志华西瓜书《机器学习》习题提示——第16章

周志华西瓜书《机器学习》习题提示——第16章

原创 2023-07-24 15:51:31 · 465 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第15章

周志华西瓜书《机器学习》习题提示——第15章

原创 2023-07-24 14:50:26 · 451 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第14章

周志华西瓜书《机器学习》习题提示——第14章

原创 2023-07-24 13:12:14 · 721 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第13章

周志华西瓜书《机器学习》习题提示——第13章

原创 2023-07-24 11:57:21 · 477 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第12章

周志华西瓜书《机器学习》习题提示——第12章

原创 2023-07-23 18:06:27 · 493 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第11章

周志华西瓜书《机器学习》习题提示——第11章

原创 2023-07-23 17:11:09 · 809 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第10章

周志华西瓜书《机器学习》习题提示——第10章

原创 2023-07-23 16:09:50 · 797 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第9章

周志华西瓜书《机器学习》习题提示——第9章

原创 2023-07-23 15:27:35 · 1699 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第8章

周志华西瓜书《机器学习》习题提示——第8章

原创 2023-07-23 11:48:43 · 1213 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第7章

周志华西瓜书《机器学习》习题提示——第7章

原创 2023-07-23 10:59:41 · 1241 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第6章

周志华西瓜书《机器学习》习题提示——第6章

原创 2023-07-22 16:02:32 · 1369 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第5章

周志华西瓜书《机器学习》习题提示——第5章

原创 2023-07-22 15:32:47 · 838 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第4章

周志华西瓜书《机器学习》习题提示——第4章

原创 2023-07-22 11:54:38 · 834 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第3章

周志华西瓜书《机器学习》习题提示——第3章

原创 2023-07-22 10:44:32 · 483 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第2章

周志华西瓜书《机器学习》习题提示——第2章

原创 2023-07-21 17:33:12 · 423 阅读 · 0 评论
周志华西瓜书《机器学习》习题提示——第1章

周志华西瓜书《机器学习》习题提示——第1章

原创 2023-07-21 16:36:07 · 286 阅读 · 0 评论
（《机器学习》完整版系列）第5章神经网络——5.4 BP算法的高级表达（简洁之美）

对数学成绩好的同学，可以学习BP算法的高级表达，即由向量和矩阵表达BP算法中的公式。

原创 2023-04-12 16:40:19 · 402 阅读 · 1 评论
（《机器学习》完整版系列）第16章强化学习——16.12 逆强化学习（逆是指回到条件中）

现在，强化学习任务的条件中，奖赏函数未知，用线性函数（近似地）表达奖赏函数（其参数未知）。逆强化学习是指学习的内容是强化学习任务某条件。基于“人类专家具有最优性”这一假定，以及多目标优化理论，交替地迭代出最优奖赏函数。

原创 2023-03-28 09:14:04 · 955 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.11 直接模仿学习

借助人类专家曾经的决策轨迹数据，进行模仿学习是一个很好的思路，特别是可作为初始化手段。广泛收集人类专家在该任务中，形成的数据集。这样，就可以用分类（离散时）或回归（连续时）算法学习出一个确定性的策略，再以此为基础就可以学习出一个概率性策略。

原创 2023-03-28 08:50:51 · 378 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.10 值函数近似

函数近似：以某种已知曲线（含参数）逼近未知函数。现在：未知函数为值函数，已知函数取线性函数

原创 2023-03-28 08:36:13 · 357 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.9 时序差分学习（Sara算法与Q-学习算法）

前述蒙特卡罗试验并没有限定轨线长度，现在把焦点放在最短轨线上：新增一步蒙特卡罗试验产生的长度为1的轨线。由于取长度为1的蒙特卡罗试验轨线（单步），即可更新一次，不再需要计数变量

原创 2023-03-27 17:31:12 · 520 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.8 异策略蒙特卡罗强化学习算法（换分布）

通过换分布进行蒙特卡罗试验（采样）来实现。求期望时“换分布”的想法及公式，有点像求对数时的“换底”

原创 2023-03-27 17:05:19 · 536 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.7 同策略蒙特卡罗强化学习

自由地执行一次长度为TT蒙特卡罗试验（并不限定起点），就可以依迭代式对该试验轨线上所有点作一次更新，依结果，对策略进行一次优化。将ϵ-贪心算法修改为同策略蒙特卡罗强化学习算法

原创 2023-03-27 16:43:05 · 297 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.6 策略迭代与值迭代算法

将策略改进序列算法化，则分别得到策略迭代与值迭代算法。

原创 2023-03-27 11:54:17 · 309 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.5 策略改进（单调递增有界序列必收敛）

有模型策略估值算法可得到所有状态在给定策略下的值，这样就可以对多个策略进行比较选优，不断地调整策略，使其达到最优。方法：构造出“勉强”的单调递增有界序列（对应策略序列），利用单调递增有界序列必收敛的定理进行推导。

原创 2023-03-27 11:36:45 · 293 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.4 有模型策略估值算法

已知策略，计算执行该策略获得的（平均）奖赏，即是策略估值，本篇利用Bellman等式【西瓜书式(16.7)(16.8)】进行策略估值。

原创 2023-03-27 10:51:22 · 267 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.3 有模型的迭代式的详细推导（并更正一些错误思路）

本篇详细推导出值函数的递归等式，称为贝尔曼方程（Bellman等式）。

原创 2023-03-27 10:15:06 · 343 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.2 K-摇劈赌博机的贪心算法（赌博当然贪心）

赌博当然贪心，所以有贪心算法。常常面临“探索-利用”窘境，贪心算法即是在二者间进行概率分配。

原创 2023-03-27 08:27:44 · 444 阅读 · 0 评论
（《机器学习》完整版系列）第16章强化学习——16.1 任务与奖赏（从MDP出发）

在马尔可夫决策过程中，“两阶段模型”是笔者独创的模型图，非常有利于教与学。定义了γ折扣累积奖赏与T步累积奖赏

原创 2023-03-26 09:21:15 · 506 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.11 基于逆归结的机器证明

把求证问题转化成一个子句集：将条件“分拆”为析取式，并加入结论的否定式，利用置换和消解得到消解式，将消解式放入子句集中，但并不删除子句，继续消解直至得到空子句，从而得证。

原创 2023-03-25 22:25:45 · 273 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.10 归纳逻辑程序设计之逆归结

在命题逻辑中我们讨论了归结与逆归结，这里我们将其推广到一阶逻辑中一阶逻辑的归结、逆归结通常用到“置换”和“合一”操作逆结归的特点之一就是能自动发明新谓词，但新谓词的语义需要领域知识进行理解

原创 2023-03-25 22:09:08 · 623 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.9 归纳逻辑程序设计之最小一般泛化

完备性与一致性有四种组合泛化是具体化和实例化的反面，就是使其更一般化，从“多条具体事实（或规则）”中得到更一般化的“一条规则”，要求该规则不与这些事实矛盾或尽可能少矛盾。

原创 2023-03-25 21:41:36 · 471 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.8 三种蕴涵（你会区分么？）

有三种蕴涵概念，需通过上下文区分。

原创 2023-03-25 07:40:47 · 904 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.7 FOIL算法（找出含逻辑变量的公式）

将基于“属性值”的训练集调整为基于“属性值比较”的训练集。对样本集进行学习，就是设法找出含逻辑变量的公式（集）。

原创 2023-03-25 07:17:41 · 771 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.6 一阶逻辑公式及“分拆”

一阶逻辑公式A与子句集S（命题规则）可相互转换。

原创 2023-03-25 06:59:45 · 400 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.5 剪枝优化(预剪枝（阻止生长）和后剪枝（“由长变短”）)

将规则的“由短变长”的过程看成是树枝生长过程，那么，对树就有剪枝，包括预剪枝（阻止生长）和后剪枝（“由长变短”）。剪枝过程涉及到规则的取舍，可以用统计显著性检验

原创 2023-03-22 18:20:01 · 444 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.4 序贯覆盖（规则集与数据集）

在训练集中，学到一条规则后，将这条规则所覆盖的样例（满足规则的样例，或叫支持该规则的样例）全去掉，形成一个较小的训练集，再在其上进行规则学习，直至训练集为空，这就是序贯覆盖法。

原创 2023-03-22 17:52:48 · 462 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.3 归结与逆归结（你可知“反证法”原理？）

归结原理（即消解）：可以“消除”该互补项

原创 2023-03-22 11:28:45 · 938 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.2 形式推理（哥德尔怎么说？）

平时我们说的“三段式”推理就是形式推理.命题逻辑体系具有可靠性和完备性，而规则又有利于机器实现，这就能实现机器自动化证明。不幸的是，数学家哥德尔证明了不完全性定理：任何形式推理系统中总存在不能证真也不能证伪的命题。

原创 2023-03-22 10:59:07 · 288 阅读 · 0 评论
（《机器学习》完整版系列）第15章规则学习——15.1 命题规则（逻辑学、布尔表达）

以命题形式的规则表达，由“条件”得到“结论”。从集合论的角度来看，具有蕴涵（包含）关系。“条件”可能分解为若干“子条件”，需要它们同时成立。通过真值表可以定义语义。

原创 2023-03-21 17:28:03 · 550 阅读 · 0 评论

周志华【西瓜书】辅导

作者: 人工干智能

周志华西瓜书《机器学习》习题提示——第16章

周志华西瓜书《机器学习》习题提示——第15章

周志华西瓜书《机器学习》习题提示——第14章

周志华西瓜书《机器学习》习题提示——第13章

周志华西瓜书《机器学习》习题提示——第12章

周志华西瓜书《机器学习》习题提示——第11章

周志华西瓜书《机器学习》习题提示——第10章

周志华西瓜书《机器学习》习题提示——第9章

周志华西瓜书《机器学习》习题提示——第8章

周志华西瓜书《机器学习》习题提示——第7章

周志华西瓜书《机器学习》习题提示——第6章

周志华西瓜书《机器学习》习题提示——第5章

周志华西瓜书《机器学习》习题提示——第4章

周志华西瓜书《机器学习》习题提示——第3章

周志华西瓜书《机器学习》习题提示——第2章

周志华西瓜书《机器学习》习题提示——第1章

（《机器学习》完整版系列）第5章 神经网络——5.4 BP算法的高级表达（简洁之美）

（《机器学习》完整版系列）第16章 强化学习——16.12 逆强化学习（逆是指回到条件中）

（《机器学习》完整版系列）第16章 强化学习——16.11 直接模仿学习

（《机器学习》完整版系列）第16章 强化学习——16.10 值函数近似

（《机器学习》完整版系列）第16章 强化学习——16.9 时序差分学习（Sara算法与Q-学习算法）

（《机器学习》完整版系列）第16章 强化学习——16.8 异策略蒙特卡罗强化学习算法（换分布）

（《机器学习》完整版系列）第16章 强化学习——16.7 同策略蒙特卡罗强化学习

（《机器学习》完整版系列）第16章 强化学习——16.6 策略迭代与值迭代算法

（《机器学习》完整版系列）第16章 强化学习——16.5 策略改进（单调递增有界序列必收敛）

（《机器学习》完整版系列）第16章 强化学习——16.4 有模型策略估值算法

（《机器学习》完整版系列）第16章 强化学习——16.3 有模型的迭代式的详细推导（并更正一些错误思路）

（《机器学习》完整版系列）第16章 强化学习——16.2 K-摇劈赌博机的贪心算法（赌博当然贪心）

（《机器学习》完整版系列）第16章 强化学习——16.1 任务与奖赏（从MDP出发）

（《机器学习》完整版系列）第15章 规则学习——15.11 基于逆归结的机器证明

（《机器学习》完整版系列）第15章 规则学习——15.10 归纳逻辑程序设计之逆归结

（《机器学习》完整版系列）第15章 规则学习——15.9 归纳逻辑程序设计之最小一般泛化

（《机器学习》完整版系列）第15章 规则学习——15.8 三种蕴涵（你会区分么？）

（《机器学习》完整版系列）第15章 规则学习——15.7 FOIL算法（找出含逻辑变量的公式）

（《机器学习》完整版系列）第15章 规则学习——15.6 一阶逻辑公式及“分拆”

（《机器学习》完整版系列）第15章 规则学习——15.5 剪枝优化(预剪枝（阻止生长）和后剪枝（“由长变短”）)

（《机器学习》完整版系列）第15章 规则学习——15.4 序贯覆盖（规则集与数据集）

（《机器学习》完整版系列）第15章 规则学习——15.3 归结与逆归结（你可知“反证法”原理？）

（《机器学习》完整版系列）第15章 规则学习——15.2 形式推理（哥德尔怎么说？）

（《机器学习》完整版系列）第15章 规则学习——15.1 命题规则（逻辑学、布尔表达）

（《机器学习》完整版系列）第5章神经网络——5.4 BP算法的高级表达（简洁之美）

（《机器学习》完整版系列）第16章强化学习——16.12 逆强化学习（逆是指回到条件中）

（《机器学习》完整版系列）第16章强化学习——16.11 直接模仿学习

（《机器学习》完整版系列）第16章强化学习——16.10 值函数近似

（《机器学习》完整版系列）第16章强化学习——16.9 时序差分学习（Sara算法与Q-学习算法）

（《机器学习》完整版系列）第16章强化学习——16.8 异策略蒙特卡罗强化学习算法（换分布）

（《机器学习》完整版系列）第16章强化学习——16.7 同策略蒙特卡罗强化学习

（《机器学习》完整版系列）第16章强化学习——16.6 策略迭代与值迭代算法

（《机器学习》完整版系列）第16章强化学习——16.5 策略改进（单调递增有界序列必收敛）

（《机器学习》完整版系列）第16章强化学习——16.4 有模型策略估值算法

（《机器学习》完整版系列）第16章强化学习——16.3 有模型的迭代式的详细推导（并更正一些错误思路）

（《机器学习》完整版系列）第16章强化学习——16.2 K-摇劈赌博机的贪心算法（赌博当然贪心）

（《机器学习》完整版系列）第16章强化学习——16.1 任务与奖赏（从MDP出发）

（《机器学习》完整版系列）第15章规则学习——15.11 基于逆归结的机器证明

（《机器学习》完整版系列）第15章规则学习——15.10 归纳逻辑程序设计之逆归结

（《机器学习》完整版系列）第15章规则学习——15.9 归纳逻辑程序设计之最小一般泛化

（《机器学习》完整版系列）第15章规则学习——15.8 三种蕴涵（你会区分么？）

（《机器学习》完整版系列）第15章规则学习——15.7 FOIL算法（找出含逻辑变量的公式）

（《机器学习》完整版系列）第15章规则学习——15.6 一阶逻辑公式及“分拆”

（《机器学习》完整版系列）第15章规则学习——15.5 剪枝优化(预剪枝（阻止生长）和后剪枝（“由长变短”）)

（《机器学习》完整版系列）第15章规则学习——15.4 序贯覆盖（规则集与数据集）

（《机器学习》完整版系列）第15章规则学习——15.3 归结与逆归结（你可知“反证法”原理？）

（《机器学习》完整版系列）第15章规则学习——15.2 形式推理（哥德尔怎么说？）

（《机器学习》完整版系列）第15章规则学习——15.1 命题规则（逻辑学、布尔表达）