- 博客(16)
- 收藏
- 关注
转载 再认识RL
马尔可夫最重要的性质时下一时刻的状态只与当前状态有关。若数据流不具备该性质,可以利用循环神经网络对历史信息进行建模,获得包含历史信息的转台表征,最后在表征状态空间求解马尔可夫决策过程问题。,计算它的价值函数,也就是计算每个状态的价值。控制就是我们去寻找一个最佳的策略,然后同时输出它的最佳价值函数以及最佳策略。贝尔曼方程就是当前状态与未来状态的迭代关系,表示当前状态的价值函数可以通过下个状态的价值函数来计算。,0表示只关注当前的奖励,1表示未来的奖励与当前的奖励一致。:未来可能获得奖励的当前价值的表现。
2023-12-12 01:16:59
88
原创 【Matplotlib学习笔记】Part5:绘图样式
part5:绘图样式学习如何自定义colormap,并将其应用到任意一个数据集中,绘制一幅图像,注意colormap的类型要和数据集的特性相匹配,并做简单解释data = np.random.randint(0,100,(30,30))# 获取内置colormapcmp1 = plt.get_cmap('cool',256)# 自定义线性cmp2 = ListedColormap(["darkorange", "gold", "lawngreen", "lightseagreen"])
2022-05-25 15:44:04
536
原创 【Matplotlib学习笔记】Part4:文字图例
Part4:文字图例思考题本文学习的text方法和matplotlib自带的柱状图标签方法bar_labelimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号ex1 = pd.re
2022-05-24 11:40:52
661
原创 【Matplotlib学习笔记】Part3:布局
Part3:布局练习题:在极坐标下绘制玫瑰图# 获取数据ex1 = pd.read_csv('layout_ex1.csv')data=ex1[0:12]# 计算角度n=data.shape[0]print(n)theta=np.linspace(0, np.pi*2, len(r), endpoint=False) # 360度等分成n份# 设置画布fig = plt.figure(figsize=(12,10))r=data['Temperature'].tolist
2022-05-23 22:15:25
173
原创 【Matplotlib学习笔记】Part2:如何绘制多种图表类型:Artist对象
Part2:如何绘制多种图表类型:Artist对象思考题1. primitives 和 container的区别和联系是什么,分别用于控制可视化图表中的哪些要素premitives是可视化的内容,包含各种标准图形对象(曲线Line2D/text/Rectangle/image);container是画布(个人理解为是画图的框架),包含figure/axes/axis/tick2. 画图示例使用提供的drug数据集,对第一列yyyy和第二列state分组求和,画出下面折线图。PA加粗标黄,其他为灰
2022-05-21 17:24:02
390
原创 【Matplotlib学习笔记】Part1:Matplotlib基础
【Matplotlib学习笔记】Part1:Matplotlib基础(含绘图通用模板)
2022-05-16 18:57:08
80
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人