【强化学习】1-0 强化学习介绍


title: 【强化学习】1-0 强化学习介绍
categories:

  • Reinforcement Learning
  • RL-An Introduction
    keywords:
  • 学习的本质
  • 引发
  • 结果
  • 计算近似
  • 直接建模
  • 强化学习
    toc: true
    date: 2018-08-22 23:35:56

weixingongzhonghao.jpg
Abstract: 本文是 《Reinforcement Learning: An Introduction》 的第一篇,介绍本书以及本系列的主要写作内容
Keywords: 学习的本质,诱发与结果(cause and effect),计算近似,直接建模,强化学习

文章来自 https://face2ai.com/RL-RSAB-1-0-Introduction/

开篇废话

本系列主要介绍强化学习,使用的教材为:

内容主要来自本教材以及其引用的论文,但是不限于此。
此外,了解我的同学可能知道我喜欢说些没用的废话,本系列该环节省略。本系列部分专业名词保持英文原文,不是为了装x,因为翻译怕不准影响后续学习。

Nature of Learning(学习的本质)

做人工智能的,或者吹人工智能的所有人应该都曾经尝试思考过,学习的本质是什么,因为我们的“智能”来自学习,可能也有一些遗传因素,我们并不了解学习或者智能的本质是什么,但是我们可以从我们的生活或者其他一些动物的行为和现象中得到一些启示:

  • 和环境的Interaction(我想翻译成:“相互影响”,但是觉得不太对)

没错,所有有智能的动物,的所有智能都是来自周围自然环境的,如果把一个人从出生就放在培养基中,完全隔绝所有能和我们行为互动的因素,那么这个人很有可能就是一个有机体,不具备任何智能的器官的组合。
而我们从出生就是开始和自然环境互动,一个婴儿,挥动胳膊,蹬一下腿,或者摇摇头,这些看起来毫无规律和目的的动作就已经跟周围产生了Interaction

Cause and Effect (诱发与结果)

本文为节选,完整内容地址 https://face2ai.com/RL-RSAB-1-0-Introduction/

转载于:https://www.cnblogs.com/face2ai/p/9756602.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值