自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

eowyn0406的博客

08月 07月 06月 05月 04月 03月 02月 01月

原创 multi-arm-bandits问题python代码

假设有k=10个摇臂的老虎机，其奖励分布满足高斯正态分布，每个摇臂对应的正态分布的均值与方差分别为： #the real mean value of each ation's reward qa_star = np.array([0.2,-0.3,1.5,0.5,1.2,-1.6,-0.2,-1,1.1,-0.6]) #the vars of each action's reward var_...

2019-03-08 17:00:03 551

原创我的第一个增强学习代码（敲弱智的）

#假设一个具有9个元素的一维数组，nimo位于第6位（索引从0开始） #下面用增强学习的思想来让agent找到nimo，并输出是第几步找到的nimo，以及获得的奖励 #本例不涉及到对策略的优化，只是采取keci-贪心算法达到搜寻目的，并不是完整的增强学习算法 import numpy as np import random def main(): print ("start lea...

2019-03-07 19:06:35 275

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

eowyn0406

CSDN认证博客专家 CSDN认证企业博客

码龄7年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

39: 原创

2万+: 周排名

50万+: 总排名

6万+: 访问

: 等级

1005: 积分

22: 粉丝

92: 获赞

42: 评论

223: 收藏

私信

关注

分类专栏

最新评论

Bellman Equation 贝尔曼方程
m0_69388475: 关于bellman方程的起源、背景和稳态的意义，作者参考了哪些资料呀，跪求
如何用四元数表示姿态差
eowyn0406: 是为了推导出Y=WX中的W啊，写成另一种形式就是Y=XW了，想写成哪种形式根据您的需求来就好了。
如何用四元数表示姿态差
eowyn0406: 我觉得可能没有实际的物理意义，就理解为从一个姿态变化到另一个姿态的映射就好了。通过距离四元数，可以将第一个姿态的四元数转换为第二个姿态的四元数。或者，理解为三个角度差的模也行。——理解不一定对，仅供参考。
如何用四元数表示姿态差
找不到服务器zhn: 表示两个坐标系的变换，可以看我的推导https://blog.csdn.net/qq_34288751/article/details/134590957
如何用四元数表示姿态差
找不到服务器zhn: 开头因为所以那段太牵强了，$q_2=q_2(q_1^{-1}q_1)$，为什么不写成 $q_2=(q_1q_1^{-1})q_2$？

最新文章

提示

确定要删除当前文章？

取消删除