python
mercurial_1110
mmm
展开
-
Deep Reinforcement Learning 强化学习详解
概念定义强化学习(Reinforcement Learning,RL),是指一类从(与环境)交互中不断学习的问题以及解决这类问题的方法. 强化学习问题可以描述为一个智能体从与环境的交互中不断学习以完成特定目标(比如取得最大奖励值). 和深度学习类似,强化学习中的关键问题也是贡献度分配问题,每一个动作并不能直接得到监督信息,需要通过整个模型的最终监督信息(奖励)得到,并且有一定的延时性.例子:多臂老虎机(Multi-Armed Bandit Problem) 悬崖行走两个对象:转载 2020-06-19 00:44:50 · 2646 阅读 · 0 评论 -
numpy.array 函数简介
import numpy as npnumpy.array 常用变量及参数dtype变量,用来存放数据类型, 创建数组时可以同时指定。shape变量, 存放数组的大小, 这人值是可变的, 只要确保无素个数不变的情况下可以任意修改。(-1为自动适配, 保证个数不变)reshape方法,创建一个改变了形状的数组,与原数组是内存共享的,即都指向同一块内存。 创建数组的方法[python] view pl...转载 2018-06-10 10:16:11 · 22748 阅读 · 1 评论 -
pyhton 正则表达式符号详解
原创 2018-06-28 10:32:05 · 215 阅读 · 0 评论