自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 学习笔记--多臂老虎机(Multi-armed Bandits)--chapter2

区分增强学习(reinforcement learning)与其他类型的学习算法的一个最大的特征在于,增强学习评估(evaluates)采取的行动(actions),而非指示(instructs)通过给予正确的行动。通过学习最简单的多臂老虎机问题,来介绍数个基础学习算法,这些算法将在后续章节被运用于完整的增强学习问题。 1. 多臂老虎机问题 反复在k个不同选项、行动中进行选择,任意选项将返回一个符...

2020-02-21 23:20:29 2183

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除