【强化学习】1-0 强化学习介绍

最新推荐文章于 2022-03-29 21:45:34 发布

非主流科学家

最新推荐文章于 2022-03-29 21:45:34 发布

阅读量378

点赞数

分类专栏：强化学习强化学习入门文章标签：人工智能强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TonyShengTan/article/details/82011059

版权

强化学习同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

强化学习入门

6 篇文章 1 订阅

订阅专栏

title: 【强化学习】1-0 强化学习介绍
categories:

Reinforcement Learning
RL-An Introduction
keywords:
学习的本质
引发
结果
计算近似
直接建模
强化学习
toc: true
date: 2018-08-22 23:35:56

Abstract: 本文是《Reinforcement Learning: An Introduction》的第一篇，介绍本书以及本系列的主要写作内容
Keywords: 学习的本质，诱发与结果(cause and effect)，计算近似，直接建模，强化学习

文章来自 https://face2ai.com/RL-RSAB-1-0-Introduction/

开篇废话

本系列主要介绍强化学习，使用的教材为：

内容主要来自本教材以及其引用的论文，但是不限于此。
此外，了解我的同学可能知道我喜欢说些没用的废话，本系列该环节省略。本系列部分专业名词保持英文原文，不是为了装x，因为翻译怕不准影响后续学习。

Nature of Learning(学习的本质)

做人工智能的，或者吹人工智能的所有人应该都曾经尝试思考过，学习的本质是什么，因为我们的“智能”来自学习，可能也有一些遗传因素，我们并不了解学习或者智能的本质是什么，但是我们可以从我们的生活或者其他一些动物的行为和现象中得到一些启示：

和环境的Interaction(我想翻译成:“相互影响”，但是觉得不太对）

没错，所有有智能的动物，的所有智能都是来自周围自然环境的，如果把一个人从出生就放在培养基中，完全隔绝所有能和我们行为互动的因素，那么这个人很有可能就是一个有机体，不具备任何智能的器官的组合。
而我们从出生就是开始和自然环境互动，一个婴儿，挥动胳膊，蹬一下腿，或者摇摇头，这些看起来毫无规律和目的的动作就已经跟周围产生了Interaction

Cause and Effect (诱发与结果)

本文为节选，完整内容地址 https://face2ai.com/RL-RSAB-1-0-Introduction/

非主流科学家

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【强化学习】1-0 强化学习介绍

Abstract: 本文是《Reinforcement Learning: An Introduction》的第一篇，介绍本书以及本系列的主要写作内容 Keywords: 学习的本质，诱发与结果(cause and effect)，计算近似，直接建模，强化学习文章来自 https://face2ai.com/RL-RSAB-1-0-Introduction/开篇废话本系列主要...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。