马上就要国赛啦,大家准备的怎么样了?正在数学公式和代码中头大吗?俗话说磨刀不误砍柴工,好的工具和方法可以令你事半功倍。这里是数学建模的笔记,精简了不必要的和过于复杂的内容,适合需要临时补习的同学
目录
软件推荐
公式插入:Mathpix
学术绘图:AxGlyph
题目选择
A题
- 偏向物理/工程类
- 专业性较强,非本专业不建议选择
- 需要根据物理定理使用微分方程和偏微分方程
- 神经网络/遗传算法等求解较优解的启发式算法一般不适用!!
- 热力学等物理题可以先建立一个非常简陋的模型,再一点点改进
B题
题型不定,19年物理类,20年运筹优化类
C题
- 偏向经管/运筹/统计/数据分析类
- 赛题开放容易读懂
- 一般没有严格最优解,结果合理即可
- 数据往往需要自己找
选题原则
- 若问题背景描述的语句都读不懂,可以优先排除
- 少数服从多数
- 先查资料文献,优先考虑资料较多的
- 啥都不会就选C题
- 尽量开赛后6小时内定题,不要轻易换题
- 万一做到一般发现做不出来,即使瞎编也要编完一整篇论文交上去,开始语文建模(bushi
搜索技巧
你真的会百度嘛?
完全匹配搜索:搜索词加上双引号"",引号中英文皆可
标题必含关键字搜索:关键词前加上intitle:,冒号为中英文
搜索特定格式的文档:查询词后空格再输入filetype:文件格式(如doc/pdf/xls等等)
例如搜索线性规划 filetype:pdf得到的就都是pdf版的资料
去掉不想要的:再搜索内容后面空格输入 -不想要的关键词
线性规划 filetype:pdf -百度文库 就得到线性规划pdf版本非百度文库的资料
查文献
中国知网 www.cnki.net
先看知网的硕博士论文:硕博士论文对研究问题有详细的背景和基础知识介绍
使用高级检索
更快查找你想要的内容
谷歌学术镜像
http://scholar.hedasudi.com/
Open Access Library
https://www.oalib.com/
文章来自顶级著名的出版商和数据库
所有文章免费下载
找数据
- 优先在知网、谷歌学术等平台搜索
- 去国家统计局网站,https://data.stats.gov.cn/
- awesome-public-datasets
- Github上的一个项目,包含经济、地理、能源、教育等多领域的数据
- https://github.com/awesomedata/awesome-public-datasets
- EPSDATA平台
- 有大量分析处理过的数据结果,不过是收费的,可以申请7天免费试用
- https://www.epsnet.cn/
- 国家信息中心
- kaggle
- 和鲸社区
数据预处理
缺失值
- 缺失太多:如缺失较多,直接删掉该项指标
- 最简单处理:均值、众数插补。定量数据用均值,定性数据用众数插补。适用于数据量较高、对个体精度要求不大的数据。
- Newton插值法:
- 根据固定公式,构造近似函数,补上缺失值
- 普遍适用性强
- 区间边缘处不稳定震荡,不适用于对导数有要求的题目
- 适用于:热力学温度、地形测量、定位等关心函数值精准不关心数据变化的
- 样条插值法:
- 用分段光滑的曲线去插值
- 适用于:零件加工、书库水流量、图像基线偏移、机器人轨迹等精度要求高没有突变的数据。
异常值
- 用正态分布3σ原则
- 计算均值和标准差
- 判断数据值是否在(μ-3σ, μ+3σ)内,不在则为异常值
- 适用总体服从正态分布的数据,不适合排队论等题目(服从泊松分布)
- 画箱型图
- 箱型图中把数据从小到大排序,下四分位数Q1是排25%的数值,上四分位数Q3是排75%的数值
- 四分位距IQR=Q3-Q1,也就是排名第75%的减去25%的数值
- 一般设置[Q1-1.5*IQR,Q3+1.5IQR]为正常值
建模过程
建模要素
- 有理论基础
- 有推导过程
- 有最终结论
- 以文字描述、数学公式、图像表格展现出来
可以不明白模型的原理,但是要明白如何使用模型,论文很多思路模型都是从参考文献和书籍搬过来的
一句名言:All Models are wrong.Some are useful.无论对错,管用即可
建模过程
摘要:最重要!展示论文研究什么问题,用了什么方法,求得社么结果,以及每一部分大致步骤。
问题重述:不是特别重要,用自己的话重述一遍,但不要照抄原问题,避免查重。
模型假设与符号说明:好的假设能让你事半功倍,但注意假设需要合理,需要举出一定的理由。将定义的重要符号列出表格说明即可。
模型建立与求解:核心部分。
- 一组公式,和对公式中每个变量的解释就是一个模型
- 查阅资料,用自己的话复述一个简单的模型,用题目中的约束一步步修改模型,再把题目中的变量带入。
- 编写代码实现并求出最终答案。
- 针对不同小问:不需要都分别建立不同模型,如果问题之间有相似性,可以每个小问对模型做改进。
模型优缺点与改进
- 这一部分不是必须的,不是所有模型都需要进行灵敏度检验。可以简单分析前文模型的优缺点,没有改进方法也可以不写。
- 分析正文模型用在哪种问题,与本文所求解的问题有何区别。是否还可以适用于别的问题
参考文献和附录
- 参考文献格式一定要规范
- 参考文献可以直接从知网导出
- 附录要附上代码,不要在网上搜到的代码复制粘贴,把变量名换一换就不会被查重
论文
论文排版
- 各级标题与正文层次分明
- 正文排版紧凑,看起来充实,没有大片空白
- 表格用标准三线表,表名在上图名在下
- 标题不超过三级
- 公式编辑,推荐mathpix,公式需要解释清楚每个变量的意义,重要公式后面带有编号