如题,我用matlab强化学习工具箱+simulink做无人机的姿态控制。假如我已经训练好了一个agent,能使姿态控制到我设定的目标值上。但我想用这个在给定的一组初始值和目标值上训练好的模型,去控制另一个不同的任务(目标值不同),以此来测试模型的泛化能力。这种情况是不是不需要再次重复训练过程呀?具体需要怎么实现呢?
拜托各位大神帮帮我,希望说得详细一些,(本人小白担心看不懂),万分感谢!!!
如题,我用matlab强化学习工具箱+simulink做无人机的姿态控制。假如我已经训练好了一个agent,能使姿态控制到我设定的目标值上。但我想用这个在给定的一组初始值和目标值上训练好的模型,去控制另一个不同的任务(目标值不同),以此来测试模型的泛化能力。这种情况是不是不需要再次重复训练过程呀?具体需要怎么实现呢?
拜托各位大神帮帮我,希望说得详细一些,(本人小白担心看不懂),万分感谢!!!