自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(145)
  • 收藏
  • 关注

原创 latlex 环境

latlex 环境,配置

2023-08-18 23:18:17 160

原创 安装时报“Cannot open.......”、“Permission denied”等问题的解决

安装时报“Cannot open.......”、“Permission denied”等问题的解决

2023-08-18 22:40:35 3065 2

原创 周志华西瓜书《机器学习》习题提示——第16章

周志华西瓜书《机器学习》习题提示——第16章

2023-07-24 15:51:31 237

原创 周志华西瓜书《机器学习》习题提示——第15章

周志华西瓜书《机器学习》习题提示——第15章

2023-07-24 14:50:26 202

原创 周志华西瓜书《机器学习》习题提示——第14章

周志华西瓜书《机器学习》习题提示——第14章

2023-07-24 13:12:14 406

原创 周志华西瓜书《机器学习》习题提示——第13章

周志华西瓜书《机器学习》习题提示——第13章

2023-07-24 11:57:21 227

原创 周志华西瓜书《机器学习》习题提示——第12章

周志华西瓜书《机器学习》习题提示——第12章

2023-07-23 18:06:27 256

原创 周志华西瓜书《机器学习》习题提示——第11章

周志华西瓜书《机器学习》习题提示——第11章

2023-07-23 17:11:09 353

原创 周志华西瓜书《机器学习》习题提示——第10章

周志华西瓜书《机器学习》习题提示——第10章

2023-07-23 16:09:50 372

原创 周志华西瓜书《机器学习》习题提示——第9章

周志华西瓜书《机器学习》习题提示——第9章

2023-07-23 15:27:35 786

原创 周志华西瓜书《机器学习》习题提示——第8章

周志华西瓜书《机器学习》习题提示——第8章

2023-07-23 11:48:43 538

原创 周志华西瓜书《机器学习》习题提示——第7章

周志华西瓜书《机器学习》习题提示——第7章

2023-07-23 10:59:41 545

原创 周志华西瓜书《机器学习》习题提示——第6章

周志华西瓜书《机器学习》习题提示——第6章

2023-07-22 16:02:32 767

原创 周志华西瓜书《机器学习》习题提示——第5章

周志华西瓜书《机器学习》习题提示——第5章

2023-07-22 15:32:47 458

原创 周志华西瓜书《机器学习》习题提示——第4章

周志华西瓜书《机器学习》习题提示——第4章

2023-07-22 11:54:38 447

原创 周志华西瓜书《机器学习》习题提示——第3章

周志华西瓜书《机器学习》习题提示——第3章

2023-07-22 10:44:32 237

原创 周志华西瓜书《机器学习》习题提示——第2章

周志华西瓜书《机器学习》习题提示——第2章

2023-07-21 17:33:12 234

原创 周志华西瓜书《机器学习》习题提示——第1章

周志华西瓜书《机器学习》习题提示——第1章

2023-07-21 16:36:07 179

原创 (《机器学习》完整版系列)第5章 神经网络——5.4 BP算法的高级表达(简洁之美)

对数学成绩好的同学,可以学习BP算法的高级表达,即由向量和矩阵表达BP算法中的公式。

2023-04-12 16:40:19 260 1

原创 (《机器学习》完整版系列)第16章 强化学习——16.12 逆强化学习(逆是指回到条件中)

现在,强化学习任务的条件中,奖赏函数未知,用线性函数(近似地)表达奖赏函数(其参数未知)。逆强化学习是指学习的内容是强化学习任务某条件。基于“人类专家具有最优性”这一假定,以及多目标优化理论,交替地迭代出最优奖赏函数。

2023-03-28 09:14:04 641

原创 (《机器学习》完整版系列)第16章 强化学习——16.11 直接模仿学习

借助人类专家曾经的决策轨迹数据,进行模仿学习是一个很好的思路,特别是可作为初始化手段。广泛收集人类专家在该任务中,形成的数据集。 这样,就可以用分类(离散时)或回归(连续时)算法学习出一个确定性的策略,再以此为基础就可以学习出一个概率性策略。

2023-03-28 08:50:51 180

原创 (《机器学习》完整版系列)第16章 强化学习——16.10 值函数近似

函数近似:以某种已知曲线(含参数)逼近未知函数。现在:未知函数为 值函数,已知函数取线性函数

2023-03-28 08:36:13 206

原创 (《机器学习》完整版系列)第16章 强化学习——16.9 时序差分学习(Sara算法与Q-学习算法)

前述蒙特卡罗试验并没有限定轨线长度,现在把焦点放在最短轨线上:新增一步蒙特卡罗试验产生的长度为1的轨线。由于取长度为1的蒙特卡罗试验轨线(单步),即可更新一次,不再需要计数变量

2023-03-27 17:31:12 283

原创 (《机器学习》完整版系列)第16章 强化学习——16.8 异策略蒙特卡罗强化学习算法(换分布)

通过换分布进行蒙特卡罗试验(采样)来实现。求期望时“换分布”的想法及公式,有点像求对数时的“换底”

2023-03-27 17:05:19 291

原创 (《机器学习》完整版系列)第16章 强化学习——16.7 同策略蒙特卡罗强化学习

自由地执行一次长度为TT蒙特卡罗试验(并不限定起点),就可以依迭代式对该试验轨线上所有点作一次更新,依结果,对策略进行一次优化。将ϵ-贪心算法修改为同策略蒙特卡罗强化学习算法

2023-03-27 16:43:05 155

原创 (《机器学习》完整版系列)第16章 强化学习——16.6 策略迭代与值迭代算法

将策略改进序列算法化,则分别得到策略迭代与值迭代算法。

2023-03-27 11:54:17 176

原创 (《机器学习》完整版系列)第16章 强化学习——16.5 策略改进(单调递增有界序列必收敛)

有模型策略估值算法可得到所有状态在给定策略下的值,这样就可以对多个策略进行比较选优,不断地调整策略,使其达到最优。方法:构造出“勉强”的单调递增有界序列(对应策略序列),利用单调递增有界序列必收敛的定理进行推导。

2023-03-27 11:36:45 128

原创 (《机器学习》完整版系列)第16章 强化学习——16.4 有模型策略估值算法

已知策略,计算执行该策略获得的(平均)奖赏,即是策略估值,本篇利用Bellman等式【西瓜书式(16.7)(16.8)】进行策略估值。

2023-03-27 10:51:22 130

原创 (《机器学习》完整版系列)第16章 强化学习——16.3 有模型的迭代式的详细推导(并更正一些错误思路)

本篇详细推导出值函数的递归等式,称为贝尔曼方程(Bellman等式)。

2023-03-27 10:15:06 161

原创 (《机器学习》完整版系列)第16章 强化学习——16.2 K-摇劈赌博机的贪心算法(赌博当然贪心)

赌博当然贪心,所以有贪心算法。常常面临“探索-利用”窘境,贪心算法即是在二者间进行概率分配。

2023-03-27 08:27:44 260

原创 (《机器学习》完整版系列)第16章 强化学习——16.1 任务与奖赏(从MDP出发)

在马尔可夫决策过程中,“两阶段模型”是笔者独创的模型图,非常有利于教与学。定义了γ折扣累积奖赏与T步累积奖赏

2023-03-26 09:21:15 242

原创 (《机器学习》完整版系列)第15章 规则学习——15.11 基于逆归结的机器证明

把求证问题转化成一个子句集:将条件“分拆”为析取式,并加入结论的否定式,利用置换和消解得到消解式,将消解式放入子句集中,但并不删除子句,继续消解直至得到空子句,从而得证。

2023-03-25 22:25:45 162

原创 (《机器学习》完整版系列)第15章 规则学习——15.10 归纳逻辑程序设计之逆归结

在命题逻辑中我们讨论了归结与逆归结,这里我们将其推广到一阶逻辑中一阶逻辑的归结、逆归结通常用到“置换”和“合一”操作逆结归的特点之一就是能自动发明新谓词,但新谓词的语义需要领域知识进行理解

2023-03-25 22:09:08 379

原创 (《机器学习》完整版系列)第15章 规则学习——15.9 归纳逻辑程序设计之最小一般泛化

完备性与一致性有四种组合泛化是具体化和实例化的反面,就是使其更一般化,从“多条具体事实(或规则)”中得到更一般化的“一条规则”,要求该规则不与这些事实矛盾或尽可能少矛盾。

2023-03-25 21:41:36 259

原创 (《机器学习》完整版系列)第15章 规则学习——15.8 三种蕴涵(你会区分么?)

有三种蕴涵概念,需通过上下文区分。

2023-03-25 07:40:47 309

原创 (《机器学习》完整版系列)第15章 规则学习——15.7 FOIL算法(找出含逻辑变量的公式)

将基于“属性值”的训练集调整为基于“属性值比较”的训练集。对样本集进行学习,就是设法找出含逻辑变量的公式(集)。

2023-03-25 07:17:41 423

原创 (《机器学习》完整版系列)第15章 规则学习——15.6 一阶逻辑公式及“分拆”

一阶逻辑公式A与子句集S(命题规则)可相互转换。

2023-03-25 06:59:45 190

原创 (《机器学习》完整版系列)第15章 规则学习——15.5 剪枝优化(预剪枝(阻止生长)和后剪枝(“由长变短”))

将规则的“由短变长”的过程看成是树枝生长过程,那么,对树就有剪枝,包括预剪枝(阻止生长)和后剪枝(“由长变短”)。剪枝过程涉及到规则的取舍,可以用统计显著性检验

2023-03-22 18:20:01 219

原创 (《机器学习》完整版系列)第15章 规则学习——15.4 序贯覆盖(规则集与数据集)

在训练集中,学到一条规则后,将这条规则所覆盖的样例(满足规则的样例,或叫支持该规则的样例)全去掉,形成一个较小的训练集,再在其上进行规则学习,直至训练集为空,这就是序贯覆盖法。

2023-03-22 17:52:48 214

原创 (《机器学习》完整版系列)第15章 规则学习——15.3 归结与逆归结(你可知“反证法”原理?)

归结原理(即消解):可以“消除”该互补项

2023-03-22 11:28:45 533

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除