1.Agent,智能体。
2.Action,动作,智能体的具体行为。其中会有若干个动作的集合,被称为动作空间。
3.Reward,奖励,智能体做出某些动作后通过与环境交互会获得一个反馈,这个反馈就是奖励,奖励分为正负奖励。
4.State,状态,是对世界的完整描述,不会隐藏世界的信息。
5.Environment,环境,指整个框架环境。
1.Agent,智能体。
2.Action,动作,智能体的具体行为。其中会有若干个动作的集合,被称为动作空间。
3.Reward,奖励,智能体做出某些动作后通过与环境交互会获得一个反馈,这个反馈就是奖励,奖励分为正负奖励。
4.State,状态,是对世界的完整描述,不会隐藏世界的信息。
5.Environment,环境,指整个框架环境。