algorithm
1、babyai
flag被藏在书里了,幸好你找到了一台找flag的机器人。
这台机器人被训练成朝着flag所在的方向前进。
你能开着机器人找到flag吗?
你可以 下载题目附件
你可以 打开网页终端 或者通过命令 nc prob02.contest.pku.edu.cn 10002
连接到题目
解析:
maze文件没有strip,放进IDA里面和源码大差不差。可以发现在readSeed函数里存在明显的溢出,溢出到了observation中。通过对源码分析,可以了解到maze是实现了强化学习的一个交互环境, agent.py则是实现了训练过程和用户交互。
与用户交互的是 agent.py 。可以发现网络模型是固定的,那么我们的目标就是让这个固定网络在