- 博客(4)
- 收藏
- 关注
原创 强化学习的数学原理笔记1:状态值及贝尔曼公式的推导
引入西湖大学赵世钰老师《强化学习的数学原理》中一个贯穿全书的例子A grid world example来解释何为状态值、如何具体计算状态值以及为什么状态值是强化学习中非常重要的一环。
2023-12-03 12:59:13 534 2
原创 统计学习笔记3:k近邻算法及其python代码实现
就像近朱者赤近墨者黑的思想一样,在k近邻算法中给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的k个实例,这k个实例的多数属于某个类,就把该输入实例分为这个类。训练k近邻模型需要确定以下三个因素:①距离的计算。②k值的选择。③损失函数。
2023-11-27 15:15:26 405
原创 统计学习笔记2:感知机学习算法的对偶形式及其python代码实现
李航老师《统计学习方法》学习笔记2:感知机学习方法的对偶形式及python代码实现
2023-11-22 22:01:59 341
原创 统计学习笔记1:感知机学习算法的原始形式及其python代码实现
李航《统计学习方法》笔记2.3.1感知机学习算法的原始形式python实例复现
2023-11-21 23:09:47 343 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人