强化学习
人工智能小a
这个作者很懒,什么都没留下…
展开
-
深度强化学习DQN网络
DQN网络原创 2022-01-29 14:57:10 · 5563 阅读 · 0 评论 -
Q-learning算法实现
Q-learning算法实现from random import randomfrom gym import Envimport gymfrom gridworld import *class Agent(): def __init__(self,env: Env): self.env = env #个体持有环境的引用 self.Q = {} #个体维护一张行为价值表 self.state = None #个体当前的观测 d原创 2022-01-24 13:42:25 · 325 阅读 · 0 评论 -
Sarsa(lambda)算法实现
Sarsa(lambda)算法实现原创 2022-01-24 13:39:20 · 362 阅读 · 0 评论 -
Sarsa算法实现
Sarsa算法from random import randomfrom gym import Envimport gymfrom gridworld import *class Agent(): def __init__(self,env: Env): self.env = env #个体持有环境的引用 self.Q = {} #个体维护一张行为价值表 self.state = None #个体当前的观测 def perf原创 2022-01-24 13:35:27 · 276 阅读 · 0 评论 -
强化学习(格子世界)
格子世界程序(策略评估、策略迭代、价值迭代)import ramdomS = [i for i in range(16)] //定义状态空间A = ["n","e","s","w"] //定义动作空间ds_actions = {"n":-4,"e":1,"s":4,"w":-1}V = [0 for _ in range(16)] //定义初始价值def dynamics(s,a): s_prime = s if (s<=3 and a=="n") or (s>=原创 2021-11-28 09:29:36 · 1021 阅读 · 0 评论