关键词:n阶机械臂单、多智能体 单智能体
参考文档:
1.《Proximal Policy Optimization Algorithms》
2.《Asynchronous Methods for Deep Reinforcement Learning》
3.《High-Dimensional Continuous Control Using Generalized Advantage Estimation》
仿真平台:MATLAB、SIMULINK
主要内容:采用MATLAB模拟机械臂并使用强化学习控制机械臂到达目标点。
现成代码是二维的,三维也可。