2020联合作战智能博弈挑战赛之(十四)初赛

博主在2020联合作战智能博弈挑战赛初赛期间,面对时间紧迫的情况,优化了蓝方战术,增加了轰炸机生存能力,尝试了DQN模型,并探讨了训练预警机的奖励策略。在研究学习框架时,遇到了平台兼容问题,学习并安装了Torch包。
摘要由CSDN通过智能技术生成

2020年9月22日笔记

热身赛到初赛期间各种意想不到的事情突发,导致备赛时间大幅缩水,感觉到了心有余而力不足,昨日又是一刻钟的时间也没能抽得出来。好在这期间断断续续也略微改善了红方,赋予了蓝方一些战术,20号大半天时间加班加点提交了一版,这样就算后面几天忙到完全没有时间,也不至于初赛交白卷。

为了能在初赛提交之前再稍微改进一下,早上六点不到只好起来继续争分夺秒一段时间。优化蓝方歼击机补位的判断效率。由于没有指派轰炸机进攻红方北部护卫舰的逻辑,暂时不指派轰炸机去北半区执行任务。

修改了一个参数,进一步增加蓝方轰炸机的生存能力。早上跑了8局,蓝方能赢5局。看来红方虽然有兵力优势,但是如果蓝方采取针对性的战术,还是有获胜的机会。

下午在群里看到有位朋友很擅长机器学习方面的算法,能独立完成DQN模型的设计与训练,刚参加完一个kaggle的halite IV竞赛。本想拉他一起组队,可惜报名时间刚刚截止。

晚上提交了第二版,后面不怎么想继续琢磨规则了。

2020年9月25日笔记

这两天单位考评,会议、要准备的材料和要交的材料太多,又白白耽误了两天时光。后面准备开始重点研究网络版了。上午先简单集成了先前编写的几个网络相关的文件至1.3.2里。

摸索如何增加待训练目标的特征维度。难点在于如何计算下列语句

s
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AlphaFinance

您的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值