自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 强化学习概览

|更新:2020.12.03 | fjy2035@foxmail.com从今天开始整理强化学习领域的知识,主要参考的资料是Sutton的强化学习书和UCL强化学习的课程。这个系列大概准备写10到20篇,希望写完后自己的强化学习碎片化知识可以得到融会贯通,也希望可以帮到更多的人,毕竟目前系统的讲解强化学习的中文资料不太多。第一篇会从强化学习的基本概念讲起,对应Sutton书的第一章和UCL课程的第一讲。强化学习在机器学习中的位置    强化学习的学习思路和人比较类似,是在实践中学习,比如学习走路

2020-12-03 20:45:16 201

转载 印在基因里面的先验知识,或许是通往强人工智能的必经之路

|更新:2020.10.29 | fjy2035@foxmail.comPaper:Deep Learning: A Critical Appraisal 原标题:印在基因里面的先验知识,或许是通往强人工智能的必经之路 作者 | 张拳石 来源 | 知乎 https://zhuanlan.zhihu.com/p/33651571https://www.sohu.com/a/328543676_99979179 导读:近日,几何智能(后

2020-10-29 13:26:47 206

原创 强化学习模块基础概念及相关知识

|更新:2020.10.28 | fjy2035@foxmail.com文章目录强化学习:1. 马尔科夫决策(MDP):2. 思想:3. 基本原理:4. 结构:如游戏是环境,人是智能体5. DQN:6. Model-based vs. Model-free:7. on-policy vs. off-policy:其他相关知识1. Multi-task learning vs. Single-task learning2. Multi-objective Optimization vs. Single-

2020-10-28 17:51:27 742

转载 Paper: Continuous Deep Q-Learning with Model-based Acceleration

|更新:2020.10.28 | fjy2035@foxmail.com参考博客:1、https://blog.csdn.net/weixin_44125720/article/details/1030986322、https://blog.csdn.net/weixin_42137700/article/details/103255186(Homomorphism-Based RL vs. Latent-Space Modeling)

2020-10-28 12:53:07 293

原创 PyTorch指定单GPU和多GPU训练及保存-加载模型(含CPU)的总结

注意:训练/测试过程中 inputs 和 labels 均需加载到GPU中。参考和综合了网上的多种方法。1. PyTorch使用指定GPU训练 - 单GPU 直接使用代码 model.cuda(), PyTorch默认从0开始的单GPU:model = Model()if torch.cuda.is_available(): model = model.cuda()有两种方法可直接指定单GPU:在终端shell:CUDA_VISIBLE_DEVICES=1 python main.p

2020-10-21 19:31:12 12434 7

转载 CSDN-新手第一课:如何转载别人的博客

注意:转载别人的HTML代码时,在复制到CSDN–markdown编辑器后,为了整个页面的布局不留大量空白,首尾代码可删除。 参考博客:https://blog.csdn.net/zhongjianblackberry/article/details/79456338 转载CSDN博客步骤: 1.CSDN博客页面右键,点击【检查】 点击检查后,页面右侧出现html代码,如下图 2.如果需要转载全文,则在html代码下侧点击选中article_content 即可,会在代码框中自

2020-10-21 17:54:08 198

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除