自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2

《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 2Chapter 2 “多臂”赌博机强化学习区别于其他学习方法最重要的特征在于:它使用训练信息来评估(evaluate)采取的行动而非直接给出正确行动的指令(instruct)。因此需要进行广泛的探索,即:明确地搜索好的行为。单独的评估反馈会表明某个行为有多好,而非它...

2020-01-12 23:16:23 1578 1

原创 JupyterLab如何在一个.ipynb文件中导入其他的.ipynb文件

JupyterLab总所周知是一款非常好用的Pyhton IDE,其是包含了Jupyter(notebook)的超集。所以,在Jupyter notebook中能做的事情,在JupyterLab中都可以做。而且能做的事情更多。但是由于JupyterLab生成的文件与Jupyter notebook类似,都是以.ipynb结尾,当用户希望以from * import * 的方式在一个.ipynb...

2019-10-09 20:47:58 5649 2

原创 《Reinforcement Learning: An Introduction》强化学习导论英文教材自译中文版Chapter 1

Chapter 1 介绍当我们思考学习的本质时,第一个来到我们脑海中的想法便是通过与环境互动来学习。当婴儿玩耍时、舞动双臂时或四处张望时,尽管没有一个明确存在的“导师”,但确是与环境产生了直接的观感联结。通过这种联结不断实践会产生大量的因果信息、行动结果信息以及能够用来指导我们如何行动以达成特定目标的信息。在生活中,这种互动无疑是我们了解自身与自身所处环境的主要来源。无论是学习如何驾驶一辆汽车还...

2019-02-19 01:03:38 7138 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除