在pg_single上震荡系数设置大一些 | 收敛更快一些 |
在ppo_single上震荡系数小 | 收敛更快一些 |
在ac_single在ppo_single的基础上更快收敛 | 收敛更快一些 |
如何对比呢?
三张图
对于时间
pg | pg 并行化 | ppo
| ppo 并行化 | 基准算法 | ||||
first-fit | round-robin | random | ||||||
工作集一 | 收敛值 | 11218 | 11212 | 11014 | 11018 | 12418 | 12304 | 12313 |
收敛次数 | 130 | 90 | 125 | 70 | ||||
工作集二 | 收敛值 | 8225 | 8202 | 8125 | 8110 | 8925 | 8666 | 8904 |
收敛次数 | 90 | 70 | 92 | 50 | ||||
工作集三 | 收敛值 | 19429 | 19409 | 18420 | 18429 | 19921 | 19698 | 19836 |
收敛次数 | 249 | 197 | 200 | 163 | ||||
工作集四 | 收敛值 | 14719 | 14515 | 14317 | 14217 | 15283 | 15160 | 15619 |
收敛次数 | 150 | 100 | 163 | 77 | ||||
工作集五 | 收敛值 | 12160 | 12006 | 11155 | 11159 | 12300 | 12174 | 12345 |
收敛次数 | 130 | 103 | 121 | 85 | ||||
工作集六 | 收敛值 | 22315 | 21313 | 20503 | 20404 | 22512 | 22347 | 22599 |
收敛次数 | 249 | 197 | 200 | 163 |
如何设置初始值?
在最差的基础(first-fit)内随机+-(5%以内)
对于非并行化: 先随机生成,再排序,再震荡(衰减因此不要太小)
- PPO在PG的基础上进行一定的平滑
对于并行化: 先随机生成,再震荡,再排序