![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
实践
文章平均质量分 97
云端FFF
not because they are easy, but because they are hard
展开
-
经典机器学习方法(7)—— 卷积神经网络CNN
本节介绍卷积神经网络CNN的基本原理,包括卷积层和汇聚层原创 2024-06-22 15:37:16 · 892 阅读 · 0 评论 -
RL 实践(7)—— CartPole【TRPO & PPO】
本文介绍 PPO 这个 online RL 的经典算法,并在 CartPole-V0 上进行测试。由于 PPO 是源自 TRPO 的,因此也会在原理部分介绍 TRPO原创 2023-08-15 11:51:47 · 784 阅读 · 2 评论 -
minGPT 代码详解(训练 GPT 模型执行两位数加法)
minGPT 是 GPT 模型的一个开源实现,因简洁干净解释性强而颇具教育意义。本文对该开源库实现的 GPT 代码进行详解,并给出一个使用它训练 GPT 模型计算两位数加法的例子原创 2023-07-31 04:59:31 · 2728 阅读 · 2 评论 -
RL 实践(6)—— CartPole【REINFORCE with baseline & A2C】
本文介绍 REINFORCE with baseline 和 A2C 这两个带 baseline 的策略梯度方法,并在 CartPole-V0 上验证它们和无 baseline 的原始方法 REINFORCE & Actor-Critic 的优势原创 2023-07-28 20:17:56 · 578 阅读 · 2 评论 -
RL 实践(5)—— 二维滚球环境【REINFORCE & Actor-Critic】
本文介绍如何用 REINFORCE 和 Actor-Critic 这两个策略梯度方法解二维滚球问题原创 2023-07-26 17:22:23 · 304 阅读 · 0 评论 -
RL 实践(4)—— 二维滚球环境【DQN & Double DQN & Dueling DQN】
本文介绍如何用 DQN 及它的两个改进 Double DQN & Dueling DQN 解二维滚球问题原创 2023-07-22 15:25:33 · 318 阅读 · 0 评论 -
RL 实践(3)—— 悬崖漫步【QLearning & Sarsa & 各种变体】
介绍 Sarsa、Expected Sarsa、N-Step Sarsa、N-Step Tree Backup、Q-Learning、Double Q-Learning 等六种经典表格型 TD Learning 算法,给出完整代码,并在自定义的经典悬崖漫步环境中进行性能对比原创 2022-12-17 20:30:34 · 2851 阅读 · 6 评论 -
RL 实践(2)—— 杰克租车问题【策略迭代 & 价值迭代】
使用策略迭代和价值迭代这两个经典的 model-based RL 方法解杰克租车问题原创 2022-10-10 12:17:30 · 1655 阅读 · 0 评论 -
RL 实践(1)—— 多臂赌博机
在多臂赌博机环境编程对比 ϵ-贪心,Decaying ϵ-贪心,UCB,汤普森采样等平衡探索和利用的方法原创 2022-09-29 13:03:58 · 613 阅读 · 0 评论 -
RL 实践(0)—— 及第平台辛丑年冬赛季【Rule-based policy】
RLChina 智能体挑战赛 - 辛丑年冬赛季的冠军代码复现报告原创 2022-06-24 07:53:44 · 1667 阅读 · 3 评论 -
经典机器学习方法(6)—— 非线性支持向量机器与核技巧
首先详细介绍核技巧与非线性SVM分类器,然后利用 sklearn 机器学习库进行非线性分类实践,并对比多种核函数原创 2022-10-08 00:38:56 · 542 阅读 · 0 评论 -
经典机器学习方法(5)—— 线性支持向量机器
详细介绍线性支持向量机的思想、理论和推导,并给出 python 实现代码原创 2022-10-05 11:56:26 · 491 阅读 · 0 评论 -
经典机器学习方法(4)—— 感知机
感知机原理分析及 pytorch 代码实现原创 2022-08-25 21:15:14 · 460 阅读 · 0 评论 -
经典机器学习方法(3)—— 多层感知机
多层感知机原理分析及 pytorch 实现原创 2022-08-18 03:22:35 · 861 阅读 · 0 评论 -
经典机器学习方法(2)—— Softmax 回归
softmax 回归是一种经典的分类算法,本文详细介绍其原理并给出 pytorch 实现代码原创 2022-05-08 01:31:53 · 1144 阅读 · 0 评论 -
经典机器学习方法(1)—— 线性回归
线性回归原理分析与 Pytorch 代码原创 2022-02-11 10:35:12 · 798 阅读 · 0 评论