自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (5)
  • 收藏
  • 关注

原创 设置终端代理

安装并配置 proxychains。

2025-06-04 16:56:45 79

原创 包括连续和离散动作空间的任务,涵盖不同的RL算法,同时仅简要提及sim-to-real背景下的类似硬参数迁移工作。

包括连续和离散动作空间的任务,涵盖不同的RL算法,同时仅简要提及sim-to-real背景下的类似硬参数迁移工作。

2025-05-30 12:08:27 719

原创 Successor features for transfer in reinforcement learning》论文阅读

之前读了《Universal Value Function Approximators 》一直对于论文中提到的迁移耿耿于怀于两点:第一,这个迁移是指什么?到底何种程度的迁移,真实像文章中 说的一样,训了10个点,然后将其扩展到没有训练的其它5个点上去吗(这不就是监督学习中的泛化吗?第二,如果不是泛化过程,而是迁移,那技术上如何实现,是把训练好的统一值函数保存下来吗?

2025-04-30 16:06:21 1051 1

原创 Universal Value Function Approximators 论文阅读(强化学习,迁移?)

这也是我前两次无解的原因之一,因为我一直以为这个实验的最终目的是吃尽可能多的豆子(每个"demon"是一个负责学习特定子目标价值函数的独立DQN实例并不是游戏中的敌人,也不是多个Pac-Man (游戏中确实只有一个Pac-Man角色)),而伪奖励(Pseudo-reward)只是子任务,会有进行迁移然后完成最终任务,但是我自始至终没有看到相关描述,所以这里的迁移很可能只是测试验证泛化性的那种意思!MS Pacman的游戏的设定在这里也改了:Pac-Man需要吃掉所有豆子同时避开敌人。

2025-04-26 16:39:47 1108 1

原创 强化学习复习,价值函数的推导——北大pdf p41(ppt75)(动手学也有)

强化学习理论学习

2025-04-21 13:26:53 953

原创 标准蒙特卡洛积分估计定义式到数值逼Robbins-Monro 形式推导过程——对应北大DRLp26

图中第二个公式是对第一个均值公式的递推形式重写,使得你可以在线更新qtq_tqt​,不需要存储所有的fxif(x_i)fxi​。当设αt1tαt​t1​,两者是等价的。

2025-04-20 20:17:07 908

原创 ros的手眼标定精度不高

推测是ARmark包的识别有一定问题,所以将这一步替换成用matlab标定工具获取相机和标定板的RT,然后用opencv函数来求解。R_all_end_to_base_1=[],R_all_chess_to_cam_1=[]建议12组以上。

2024-07-03 14:55:13 301

原创 转urdf和dae

转urdf和dae

2022-11-22 21:35:25 989 2

原创 socket发送字符串和数组

socket发送数组和ros嵌入

2022-11-22 20:51:21 1461

原创 彻底删除code

彻底删除code

2022-11-22 19:54:08 558

原创 学习机械臂强化学习(现有资源https://zhuanlan.zhihu.com/p/372962974)

机械臂强化学习,别人的代码学习记录1

2022-11-19 20:39:57 3027

原创 ros中绕过控制器直接更新robot的状态

ros绕过控制器更新robot状态

2022-07-15 13:47:00 273

原创 Vscode突然没法调试python2.7

Vscode突然没法调试python2.7,且报错: ...........import _thread as thread; verify_shadowed.check(thread, ['start_new_thread', 'start_new', 'allocate_lock']) ImportError: No module named _thread。国内很多帖子都说改啥launch,这是不对的,重装后也没用,这是因为python的微软宽展包出了问题,把他回滚到22年之前就行了(大概率是不

2022-05-08 17:39:12 1873 7

原创 2021-05-31

![在这里插入图片描述](https://img-blog.csdnimg.cn/20210531212646812.png这是莫烦第二个小例子中的Q表,注意他Q表和奖励函数的选择,我觉着这才是关键,为何这么选择我不清楚,已经向作者提问,也许后面自己也能悟到。...

2021-05-31 21:30:25 103

原创 2021-04-26

按照moveit教程安装IKfast在编译OpenRAVE大概率报错,原因是编译过程未能添加18.04的特征码:编译过程替换成:cd openravegit reset --hard 7c5f5e27eec2b2ef10aa63fbc519a998c276f908mkdir buildcd buildcmake -DODE_USE_MULTITHREAD=ON -DCMAKE_CXX_STANDARD=11 \ -DBoost_NO_S...

2021-04-26 13:05:48 279

原创 UR5,该包集成了ur5TCP控制movej movel等,但是控制频率未验证

pip install urx

2021-04-15 15:51:55 767

原创 2021-04-15记录下moveit和ros controler

moviet movegroup Python接口一共有三大classMoveGroupCommanderclass, aPlanningSceneInterfaceclass, and aRobotCommanderclass.(均在moveit_commandernamespace)另外还提供了一个moveit_commander,这是MoveGroupCommander种笛卡尔的包装版本吗?cpp似乎多一点:TheMoveGroupInterfaceclass can ...

2021-04-15 11:08:01 296

原创 2021-03-25Ubuntu常用命令记录:

Ubuntu常用命令记录:调整系统字体大小:gsettings set org.gnome.desktop.interface text-scaling-factor 1.2

2021-03-25 16:48:12 268

matlab+opecv手眼标定方案

matlab+opecv手眼标定方案

2024-07-03

自己写的DDPG怎么都不收敛,库函数很快收敛的学习经过

自己写的DDPG怎么都不收敛,库函数很快收敛的学习经过

2022-12-12

编写自己的话题,为了与ros时间戳同步,需要接收/state,我们只更改msg.position=[0,0,0,0,0,0]

ros中绕过控制器直接更新robot的状态

2022-07-15

加了res相机的ur5环境

加了res相机的ur5环境

2022-07-14

关于ros的kuka项目联合仿真环境

关于ros的kuka项目联合仿真环境

2022-07-14

直接向控制器发送轨迹位置,不经过plan接口

import rospy import actionlib from control_msgs.msg import FollowJointTrajectoryAction, FollowJointTrajectoryGoal from trajectory_msgs.msg import JointTrajectory, JointTrajectoryPoint class TrajectoryDemo(): def __init__(self): rospy.init_node('trajectory_demo') # 是否需要回到初始化的位置 reset = rospy.get_param('~reset', False) # 机械臂中joint的命名 arm_joints = ['joint1', 'joint2', 'joint3',

2022-07-14

openrave-installation.zip

git上有,我搬运下,可以直接按脚本运行安装(适用16-20)

2021-04-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除