今年9月19日至23日,参加了本年华为杯研究生数学建模比赛。本来我就是划水的coder,抱腿两个数学系的同学,划划水。但意外获得国三。总结一下在这次建模比赛的一些经验。
1、选题
我们选择的数学题E题《加拿大气候变化》。首先,因为我们基本都是非工科出身,对于真正工程应用的模型建立缺少经验,所以选择数据方面的题对于我们队员学科背景的组成更加。
2、分工
比赛的时间安排其实非常紧张,最后需要提交一篇论文,所以在当中建模、数据处理、撰写论文、排版方面各个环节都要有明确的分工。
我的方向是数据挖掘、数据分析,所以我承担了题目所有数据的挖掘和处理。
队友的方向是建模,所以我在准备数据的时候,他们在查找资料,看文献,准备模型。时间不会耽误。
3、数据挖掘、分析
题目中给出了加拿大气象数据的下载方法,但是远远不够模型所需要的数据量,但是,给出的网站里提供了使用脚本下载的方法,类似于 wget的方法,使用python的第三方库 requests 做了下载。下载速度很慢,如果有国外服务器的话 其实会很快,道理你懂得。
数据分析这块,python提供的pandas来读取excel文件,还有matplotlib来绘制图形也非常的方便,基本写一个脚本,数据基本都可以出来,不需要很多的计算。
4、体力分配
建模比赛,比较熬人的就是熬夜了,可能前后熬了两个通宵,第一天晚上下载数据的时候放上脚本我就回去了, 中途来写了读取数据处理的脚本,剩下的就是在准备数据图。
体力真的很重要,可能熬一个通宵出来,第二天人都是飘得,参加比赛提交论文之后,我在宿舍睡了一天才缓过来。所以,抓紧白天的效率,就有可以避免晚上熬夜。
5、绘图与排版
其实呢,说实话,建模比赛重要的不是结果如何,即最终预测的结论是否合适不太重要,而是过程中也就是在论文中体现的数学方法,通过几天的模型选取、建立,对于模型有一定准确性的验证即可。所以,最后的论文一定要重视,特别是摘要的写作,一定要写完队员和导师之间多次修改。论文的结构可以参考往年优秀论文,排版按照官方给出的格式,排版完之后打印出来看一下效果,再回到电子档上修改。绘图的标准每个人选择的方法不同,我就是使用matplotlib 出来的图形也比较清晰,修改也比较方便。如果你用excel绘图。。 那可就。。。。
5、MD5与上传
切记,一定要在论文保存成功后,确定没有任何修改了再生成MD5,即使你打开文件,再重新保存一遍MD5也会有变化,所以一定一定要切记!!
上传建议在上传通道关闭前30分钟,上传避免网络堵塞造成不必要与组委会和学校沟通的麻烦。
本文地址:KEVINGUO.CN 大数据 人工智能