数据处理

 

在pg_single上震荡系数设置大一些   收敛更快一些
在ppo_single上震荡系数小收敛更快一些
在ac_single在ppo_single的基础上更快收敛收敛更快一些

如何对比呢?

三张图

对于时间

  pg

pg

并行化

ppo

 

ppo

并行化

基准算法
  first-fitround-robinrandom
工作集一收敛值11218112121101411018124181230412313
收敛次数1309012570
工作集二收敛值8225820281258110892586668904
收敛次数90709250
工作集三收敛值19429194091842018429199211969819836
收敛次数249197200163
工作集四收敛值14719145151431714217152831516015619
收敛次数15010016377
工作集五收敛值12160120061115511159123001217412345
收敛次数13010312185
工作集六收敛值22315213132050320404225122234722599
收敛次数249197200163

如何设置初始值?

在最差的基础(first-fit)内随机+-(5%以内)

对于非并行化: 先随机生成,再排序,再震荡(衰减因此不要太小)

  • PPO在PG的基础上进行一定的平滑

对于并行化: 先随机生成,再震荡,再排序

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值