自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 用anaconda下载安装pytorch1.8.1+cudatoolkit11.1

设置清华镜像下载:conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/conda config --set show_channel_urls yesconda config --add channels https:/

2021-05-04 23:41:50 11454 6

原创 如何使用Python构建自己的MuZero AI

MuZero伪代码详解作者:David Foster发表时间:2019年12月2日原文连接:MuZero: The Walkthrough(Part1/3),https://medium.com/applied-data-science/how-to-build-your-own-muzero-in-python-f77d5718061aMuZero: The Walkthrough(Part1/3),https://medium.com/applied-data-science/how-to-b

2021-04-09 14:42:03 1498 2

翻译 MuZero:用学习模型规划玩转雅达利、围棋、国际象棋和日本将棋

概述长期以来,构建具有规划能力的智能体一直是人工智能研究的主要挑战之一。基于树的规划方法在具有挑战性的领域获得了巨大的成功,例如象棋和围棋,这些领域都有一个完美的模拟器。然而,在现实世界中,动态控制环境往往是复杂和未知的。在这项工作中,我们提出了MuZero算法,该算法通过将基于树的搜索与模型学习相结合,在一系列极具挑战性的、视觉的复杂领域实现了超人的性能,而不需要了解它们的基本动力学。MuZero学习得到一个模型,当迭代应用时,该模型可以预测与计划最直接相关的数量:奖励、动作选择策略和价值函数。当对57

2021-03-10 22:59:24 2249

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除