2024国赛C题:基于强化学习和启发式算法的种植策略搜索方法
具体介绍和代码请移步github!(求star求求了,给点鼓励)
建议直接看github(https://github.com/ArrebolBlack/CUMCM2024_C)
https://github.com/ArrebolBlack/CUMCM2024_C
如果有更深的思路、代码讲解需求,请star后留言,根据反馈会出后续
正文
大家好,我是参加2024年全国大学生数学建模竞赛 (CUMCM) C题的一位选手,在这篇博客中,我将分享我对于C题的解答思路、代码结构以及所用算法。希望能为同样对这个题目感兴趣的朋友提供一些思路和帮助。
C题大多数做法可能是当优化问题去做了,搞一些传统的优化模型什么的,我觉得这种方法没什么新意和挑战性,还是得来点不一样的
问题背景与核心思路
2024年的C题可以看作是在所有种植策略的空间中进行搜索的问题,或者是一个典型的序列生成问题。我的解法主要分为两个步骤:
- 构建评估函数:首先构造一个充分的评估函数,计算不同种植策略的总利润,即目标得分。
- 强化学习环境:基于评估函数定义一个强化学习环境,并在动作空间中进行搜索,逐步优化种植策略。