2020年8月10日笔记
没有足够的时间来参加这个比赛,只能抽零星时间缓慢推进。对于强化学习而言,获取任意时刻的态势信息至关重要。在该项目中,态势信息存储于state.json,step函数至关重要。到了凌晨快一点,终于对代码的框架结构进一步熟悉了。
智能体的行动依赖于态势信息。对每一个智能体而言,根据当前态势执行step函数并返回指令集;进行行为校验后执行指令集。丰富的行为空间可以增强作战单位的灵活性,同时也会增加计算的耗费。
2020年8月11日笔记
继续熟悉源码。确认了作品提交需要包含的内容。再一次运行可视化界面进行观察。
2020年8月12日笔记
由于举办方将软件版本升级到了1.3,又花了不少时间去配环境。
2020年8月13日笔记
可以开始简单修改run.py了,发现了白皮书给的初始兵力和代码中能调用的单位不相符,没有投入全部兵力。开始搭文档框架、琢磨待提交代码的目录。加入字典以增加输出的可读性。
2020年8月14日笔记