深度学习-强化学习Q-learning算法简易实现

最新推荐文章于 2024-06-16 22:42:04 发布

Vivinia_Vivinia

最新推荐文章于 2024-06-16 22:42:04 发布

阅读量631

点赞数

分类专栏：深度学习文章标签： Q-learning 强化学习深度学习

本文链接：https://blog.csdn.net/hester_hester/article/details/103256322

版权

本文介绍了如何在深度学习中实现强化学习的Q-learning算法，通过公式讲解和代码展示，详细阐述了Q-learning的工作原理及其在智能决策中的应用。

摘要由CSDN通过智能技术生成

目标效果：

这里贴一下Q-learning的公式：

代码：

import numpy as np
import pandas as pd
import time
np.random.seed()   # 计算机产生一组伪随机数列
N_STATES=6   # 有多少个state，即有多少种状态，最开始的距离离宝藏的距离多少步
ACTIONS=['left','right']   # 两个可选动作
EPSILON=0.9   # 90%选择最优的动作，10%选择随机的动作
ALPHA=0.1   # 学习效率
LAMBDA=0.9   # 未来奖励的衰减值
MAX_EPISODES=5   # 只玩15回合
FRESH_TIME=0.1   # 规定走一步花的时间有多长

"""创建价值表格"""
def build_q_table(n_states,actions):
    table=pd.DataFrame(   # 使用pandas创建一个表格，表示向左走向右走的价值高低
        np.zeros((n_states,len(actions))),
        co

最低0.47元/天解锁文章

Vivinia_Vivinia

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
深度学习-强化学习Q-learning算法简易实现

目标效果：这里贴一下Q-learning的公式：代码：import numpy as npimport pandas as pdimport timenp.random.seed() # 计算机产生一组伪随机数列N_STATES=6 # 有多少个state，即有多少种状态，最开始的距离离宝藏的距离多少步ACTIONS=['left','right'] # 两...
复制链接

扫一扫

专栏目录