自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 资源 (1)
  • 收藏
  • 关注

原创 离线强化学习算法集锦

本文介绍了多种离线强化学习算法的实现,包括BCQ、BEAR、TD3-BC、CQL、IQL、AWAC和BC。这些算法都可以独立运行并测试,旨在通过离线数据进行训练,并在最后提供了基于PyTorch的代码实现。具体介绍了每种算法的原理和特点,包括从离线数据中学习策略、自举方法减少误差积累、行为克隆结合双延迟DDPG等技术。文章提供了GitHub项目地址和csdn资源链接,读者可以获取更多详细信息和代码实现。

2024-03-11 17:26:46 440

原创 在线强化学习算法集锦

本文实现了多种在线强化学习算法,包括Q-learning、SARSA、DQN、Double-DQN、Dueling-DQN、PG、AC、PPO、DDPG、TD3、SAC。每个算法都能独立运行并测试,提供了PyTorch版本的代码实现。这些算法覆盖了值迭代、策略优化、深度学习等多个方面,适用于不同环境和问题。欢迎访问GitHub项目地址获取详细信息和代码实现。此外,你也可以在csdn上找到同步的资源。

2024-02-01 10:05:36 542

原创 win11下 “pytorch导出模型“ 以及 “C++使用onnxruntime部署”

探讨了在Win11环境下,通过PyTorch训练鸢尾花分类模型,并将其导出为ONNX格式。第一部分详细介绍了数据准备、模型训练和导出的过程。第二部分则聚焦于C++和ONNX Runtime,展示了如何在C++环境中加载和运行导出的模型,实现模型在不同平台上的高效推理。这个博客提供了一个完整的指南,帮助读者从训练模型到在实际应用中进行推理的全流程。

2024-01-29 14:21:24 762 2

原创 算法刷题打卡第100天:使数组中所有元素都等于零 (完结)

每日一题:使数组中所有元素都等于零

2023-02-24 09:42:22 491 1

原创 算法刷题打卡第99天:至少在两个数组中出现的值

每日一题:至少在两个数组中出现的值

2023-02-23 10:20:26 493

原创 算法刷题打卡第98天:统计同构子字符串的数目

每日一题:统计同构子字符串的数目

2023-02-22 10:50:30 358

原创 算法刷题打卡第97天:删除字符串两端相同字符后的最短长度

每日一题:删除字符串两端相同字符后的最短长度

2023-02-21 13:31:00 309

原创 算法刷题打卡第96天: 最好的扑克手牌

每日一题:最好的扑克手牌

2023-02-20 08:49:30 273

原创 算法刷题打卡第95天: 最大平均通过率

每日一题:最大平均通过率

2023-02-19 14:08:20 329

原创 算法刷题打卡第94天: 找出给定方程的正整数解

每日一题:找出给定方程的正整数解

2023-02-18 17:30:56 650

原创 算法刷题打卡第93天: 最大的以 1 为边界的正方形

每日一题:最大的以 1 为边界的正方形

2023-02-17 11:10:08 348

原创 算法刷题打卡第92天:数组能形成多少数对

每日一题:数组能形成多少数对

2023-02-16 10:09:02 234

原创 算法刷题打卡第91天:统计一个圆中点的数目

每日一题:统计一个圆中点的数目

2023-02-15 11:43:50 322

原创 算法刷题打卡第90天:表现良好的最长时间段

每日一题:表现良好的最长时间段

2023-02-14 11:42:30 381

原创 算法刷题打卡第89天:替换子串得到平衡字符串

每日一题:替换子串得到平衡字符串

2023-02-13 14:16:03 326

原创 算法刷题打卡第88天:字母板上的路径

每日一题:字母板上的路径

2023-02-12 17:50:49 255

原创 算法刷题打卡第87天:装满杯子需要的最短总时长

每日一题:装满杯子需要的最短总时长

2023-02-11 13:55:38 327

原创 算法刷题打卡第86天:具有给定数值的最小字符串

每日一题:具有给定数值的最小字符串

2023-02-10 14:01:42 352

原创 算法刷题打卡第85天:设计一个验证系统

每日一题:设计一个验证系统

2023-02-09 14:21:24 246

原创 算法刷题打卡第84天:删除子文件夹

每日一题:删除子文件夹

2023-02-08 14:30:04 384

原创 第一章:线性回归原理推导

本章节描述了回归问题的概述、误差项的定义、独立同分布的含义、似然函数的作用、参数求解、梯度下降通俗解释以及参数更新方法

2023-02-07 17:58:22 68

原创 算法刷题打卡第83天:警告一小时内使用相同员工卡大于等于三次的人

每日一题:警告一小时内使用相同员工卡大于等于三次的人

2023-02-07 15:58:20 193

原创 算法刷题打卡第82天:计算布尔二叉树的值

每日一题:计算布尔二叉树的值

2023-02-06 22:02:50 342

原创 算法刷题打卡第81天:兼具大小写的最好英文字母

每日一题:兼具大小写的最好英文字母

2023-02-05 12:20:55 233

原创 算法刷题打卡第80天:你能构造出连续值的最大数目

每日一题:你能构造出连续值的最大数目

2023-02-04 14:03:46 455

原创 算法刷题打卡第79天:生成平衡数组的方案数

每日一题:生成平衡数组的方案数

2023-02-03 10:11:52 181

原创 算法刷题打卡第78天:统计星号

每日一题:统计星号

2023-02-02 10:28:00 269

原创 算法刷题打卡第77天:解密消息

每日一题:解密消息

2023-02-01 09:56:59 476

原创 算法刷题打卡第76天:判断矩阵是否是一个 X 矩阵

每日一题:判断矩阵是否是一个 X 矩阵

2023-01-31 09:45:14 305

原创 算法刷题打卡第75天:合并两个链表

每日一题:合并两个链表

2023-01-30 09:41:42 205

原创 算法刷题打卡第74天:计算应缴税款总额

每日一题:计算应缴税款总额

2023-01-23 16:52:16 1381

原创 算法刷题打卡第73天:第一个出现两次的字母

每日一题:第一个出现两次的字母

2023-01-22 14:30:42 1218

原创 算法刷题打卡第72天:最少侧跳次数

每日一题:最少侧跳次数;祝大家新的一年,不要含蓄,就是要贪。

2023-01-21 16:59:53 1605

原创 算法刷题打卡第71天:查找用户活跃分钟数

每日一题:查找用户活跃分钟数

2023-01-20 17:54:14 1535

原创 算法刷题打卡第70天:强密码检验器 II

每日一题:强密码检验器 II

2023-01-19 11:41:00 1375

原创 算法刷题打卡第69天:重排字符形成目标字符串

每日一题:重排字符形成目标字符串

2023-01-18 16:21:26 432 1

原创 算法刷题打卡第68天:统计一个数组中好对子的数目

每日一题:统计一个数组中好对子的数目

2023-01-17 17:11:11 341

原创 算法刷题打卡第67天:句子相似性 III

每日一题:句子相似性 III

2023-01-16 18:43:53 487

原创 算法刷题打卡第66天:极大极小游戏

每日一题:极大极小游戏

2023-01-15 19:13:19 522

原创 算法刷题打卡第65天:翻转二叉树

翻转二叉树难度:简单给你一棵二叉树的根节点 root ,翻转这棵二叉树,并返回其根节点。

2023-01-14 20:33:32 42

pytorch实现的离线强化学习7种常见算法代码

这个资源包含了BC、BCQ、BEAR、TD3-BC、CQL、IQL、AWAC七种离线强化学习算法的实现,每个算法文件夹都可以独立运行并测试相应算法在不同环境中的性能。

2024-03-11

pytorch实现的在线强化学习11种常见算法代码

这个资源是一个包含了使用 PyTorch 实现的11种常见在线强化学习算法的代码集合。每个算法都有独立的文件夹,可以单独运行并测试相应算法在不同环境中的性能。以下是资源中包含的算法: 1、Q-learning 2、SARSA 3、DQN (Deep Q-Network) 4、Double-DQN 5、Dueling-DQN 6、PG (Policy Gradient) 7、AC (Actor-Critic) 8、PPO (Proximal Policy Optimization) 9、DDPG (Deep Deterministic Policy Gradient) 10、TD3 (Twin Delayed DDPG) 11、SAC (Soft Actor-Critic)

2024-02-01

中文开源情感词典最全合集

提供中文开源情感文件中最全的词典,包括Hownet情感词典全,清华情感词典全,台湾大学情感词典全,情感词典及其分类,汉语情感词极值表,褒贬词及其近义词,否定词等。

2022-10-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除