- 博客(132)
- 资源 (1)
- 收藏
- 关注
原创 离线强化学习算法集锦
本文介绍了多种离线强化学习算法的实现,包括BCQ、BEAR、TD3-BC、CQL、IQL、AWAC和BC。这些算法都可以独立运行并测试,旨在通过离线数据进行训练,并在最后提供了基于PyTorch的代码实现。具体介绍了每种算法的原理和特点,包括从离线数据中学习策略、自举方法减少误差积累、行为克隆结合双延迟DDPG等技术。文章提供了GitHub项目地址和csdn资源链接,读者可以获取更多详细信息和代码实现。
2024-03-11 17:26:46 440
原创 在线强化学习算法集锦
本文实现了多种在线强化学习算法,包括Q-learning、SARSA、DQN、Double-DQN、Dueling-DQN、PG、AC、PPO、DDPG、TD3、SAC。每个算法都能独立运行并测试,提供了PyTorch版本的代码实现。这些算法覆盖了值迭代、策略优化、深度学习等多个方面,适用于不同环境和问题。欢迎访问GitHub项目地址获取详细信息和代码实现。此外,你也可以在csdn上找到同步的资源。
2024-02-01 10:05:36 542
原创 win11下 “pytorch导出模型“ 以及 “C++使用onnxruntime部署”
探讨了在Win11环境下,通过PyTorch训练鸢尾花分类模型,并将其导出为ONNX格式。第一部分详细介绍了数据准备、模型训练和导出的过程。第二部分则聚焦于C++和ONNX Runtime,展示了如何在C++环境中加载和运行导出的模型,实现模型在不同平台上的高效推理。这个博客提供了一个完整的指南,帮助读者从训练模型到在实际应用中进行推理的全流程。
2024-01-29 14:21:24 762 2
pytorch实现的离线强化学习7种常见算法代码
2024-03-11
pytorch实现的在线强化学习11种常见算法代码
2024-02-01
中文开源情感词典最全合集
2022-10-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人