资料来源:【数学建模快速入门】数模竞赛基础+MATLAB入门+论文写作+数学模型算法(数模美赛国赛小白零基础必看教程)_哔哩哔哩_bilibili
概述:因每一章节课件分开保存,查阅不便,便来此做一个整合。
软件安装
要与队友安装同版本的
- Matlab: 大多高校本身已购买,学生邮箱注册即可。或下载使用30天,又或利用搜索引擎搜索
- Mathpix:截图即可获得公式编辑的软件。学生邮箱注册可获得每月50次扫描机会。
- AxGlyph:学术绘图,比matlab和excle高效 (付费)
搜索引擎使用技巧
完全匹配搜索 : 查询词的外边加上双引号 " "
- 引号中英文均可
- 例如搜索 “CT参数标定”,得到的结果不是分别带有“CT”或“参数标定”的网页.
标题必含关键词 : 查询词前加_上intitle:
- 冒号为英文输入下的
- 例如搜索 intitle:CT参数标定,则搜索结果里每一个标题都会带有“CT参数标定
搜索文档: 例如查询词后空格再输入filetype:文件格式(doc/pdf/xls/等等)。
- 例如搜索: 线性规划 filetype:pdf 得到的就都是pdf版的资料
去掉不想要的:查询词后面加空格后加减号与关键字
- 例如搜索后不想看百度文库的东西,搜索 线性规划 filetype:pdf -百度文库
查文献技巧
中国知网
优先选择中国知网
高级检索: 想了解神经网络在信贷策略中的应用,想找一些相关的硕博论文。
- 进入高级检索界面,“+” 和 “-” 可以自定义增加和减少检索字段
- 主题为: 企业信贷
- OR 主题为: 信贷决策
- AND 关键词: 神经网络,词频设置为“模糊”。模糊”是输入的检索词在检索结果中出现即可,字序、字间间隔可以产生变化。
- 检索结果可按“相关度”或“被引”排序
其他:
谷歌学术镜像网站
国内不能访问谷歌学术,而镜像对一个网站内容的拷贝
Open Access Library (OALib)
文章都来自顶级著名的出版商和数据库,可以满足各个领域学者的需求。所有文章免费下载
找数据
- 中国知网、谷歌学术等平台
- 优先在这些地方搜索
- 国家统计局:国家数据 (stats.gov.cn)
- 最全面,月度季度年度,各地区各部门各行业,包罗万象
- 其他国家部门网站大多都有数据分页,如果需要可另行查找
- GitHub - awesomedata/awesome-public-datasets: A topic-centric list of HQ open datasets.
- GitHub上的一个项目,包舍了经济、地理、能源、教育等所有你能想到的领域的数据
- 需要进行科学上网
- EPSDATA平台
- EPSDATA平台有丰富的数据资源和大量分析处理过的数据结果,是收费的,不过可以申请7天的试用。
- 科学上网
数据预处理
缺失值
比赛提供的数据,发现有些单元格是null或空的
处理方法:
缺失太多:例如调查人口信息,发现“年龄”这一项缺失了40%,就直接把该项指标删除
插值:
- 最简单处理: 均值、众数插补
- 定量数据,例如关于一群人的身高、年龄等数据,用整体的均值来补缺失。
- 定性数据,例如关于一群人的性别、文化程度;某些事件调查的满意度,用出现次数最多的值补缺失。
- 适用赛题: 人口的数量年龄、经济产业情况等统计数据,对个体精度要求不大的数据。
- Newton插值法
- 根据固定公式,构造近似函数,补上缺失值,普遍适用性强
- 缺点: 区间边缘处的不稳定震荡,即龙格现象。不适合对导数有要求的题目
- 适用赛题:热力学温度、地形测量、定位等只追求函数值精准而不关心变化的数据
- 样条插值法
- 用分段光滑的曲线去插值,光滑意味着曲线不仅连续,还要有连续的曲率
- 适用赛题:零件加工,水库水流量,图像“基线漂移”,机器人轨迹等精度要求高、没有突变的数据
- (该三种方法足够用,其他方法例如分段插值、Hermite插值就不再一一介绍了)
异常值:
样本中明显和其他数值差异很大的数据,例如一群人的身高数据中有个3米2的。
判断方法:
- 正态分布
- 数值分布在
中的概率为99.73%,其中
为平均值,
为标准差
- 求解步骤: 1.计算均值
和标准差
;2.判断每个数据值是否在
内,不在则为异常值
- 适用题目: 总体符合正态分布,例如人口数据、测量误差、生产加工质量、考试成绩等
- 不适用题目: 总体符合其他分布,例如公交站人数排队论符合泊松分布
- 数值分布在
- 画箱型图
- 箱型图中,把数据从小到大排序。分下四分位数Q1,是排第25%的数值;上四分位数Q3,是排第75%的数值。
- 四分位距IQR = Q3- Q1,也就是排名第75%的减去第25%的数值
- 与正态分布类似,设置个合理区间,在区间外的就是异常值
- 一般设 [ Q1 - 1.5 * IQR,Q3 + 1.5 * IQR ] 内为正常值
- 适用题目: 普遍适用
处理方法与正态分布一致。
建模与求解
《大学物理》写的内容中就是数学建模的一个过程
新人:比赛开始后先查文献,一切以现有的他人成果为基础。看不懂原理没关系,把论文“编写”出来就行。
整篇论文,很多思路、模型等都是从参考文献和书籍搬过来的。不论对错,管用就行。
建模过程
一篇完整的数模论文包括:
- 摘要(最重要)
- 问题重述
- 模型假设和符号说明
- 模型建立与求解 (最长)
- 模型的优缺点与改进方法
- 参考文献和附录
摘要: 最重要
读者看完摘要,就知道论文研究的问题、用了什么方法、求得了什么结果,以及每一部分的大致步骤。
问题重述
将题目简述一遍即可,并不重要。注意不要复制粘贴,避免查重
模型假设和符号说明
好的假设能让你事半功倍
例如某一年太阳投影问题,影子长度与地球公转也有关系,但地球公转对影长的影响远远小于自转,可在模型假设里说明“忽略公转对影长的影响”
符号说明将论文中定义的重要符号列出表格说明即可
模型的建立
一组公式,和对公式中每个变量的解释,就是一个模型
先查阅资料,看着资料,用自己的话复述一个简单的模型,再根据题目中的约束条件去一步步修改模型,把题目中的变量带入模型中去
模型的求解
例如上文我们所建立的最短路径模型,查阅资料可知单源最短路径的常用算法是Diikstra算法,那么模型的求解过程可以把资料上的用自己的话复述一遍:
采用Dijkstra算法求解 : (以下内容可以百度或从常见资料里找到)
- 从起始点开始,将起点放进集合N中,查找所有与其相连的节点及到达下一节点的花费并且记录下来;
- 接下来选择花费最短的一条路径,到这条最短路径指向的节点去,把这个点也放进集合N中,然后查找所有与这个节点相连的其他不在集合N中的点,并且也计算到达下一点所需要的花费并记录下来。保存花费最小的一条记录;
- 继续选择花费最短的路径重复执行第2步,一直到所有的点都已有了最短路径,完毕
需要注意的是,必须根据赛题解释清楚实际意义是什么、最短路径意味着什么
不同小问
并不是针对题目的每一问都要建立一个模型
如果每小问之间具有相似性、仅仅是增加了约束条件的话,完全可以全文建立一个模型,再针对每一小问进行模型改进。
模型的优缺点与改进方法
这一部分不是必须的,可以简单分析下前文模型的优缺点,若没有改进方法也可不写
结合查到的文献,分析正文中模型常用在什么哪种问题,又与本文所求解的问题有何区别
参考文献
格式一定要规范,在正文对应部分添加右上角的角标
知网检索结果右侧有引用按钮,打开后复制即可
如果需要用到博客等网站上公开的内容,可以借鉴,但不要照抄,用自己的话复述后,就不必加入参考文献。

附录
附录里要写出正文中求解时用到的代码
一定不要把网上搜到的代码直接复制粘贴! 把查到的代码里变量名换一换就不会被查重
论文排版
各级标题与正文层次分明
一般标题级别不超过三级
正文中文字体设置宋体、英文Times New Roman
正文排版紧凑,看起来充实,没有大片空白
避免图片过大导致出现大片空白,且不要留有空行
表格与图片
表格用标准的三线表
表的标题放在表的上方,图名放在图的下方
每个公式、图和表格都要标号!

公式编辑
推荐mathpix,或用word的公式编辑器
公式需要解释清楚每个变量的意义; 重要的公式后面带有编号
最好别用截图
巧用分页符
分页符所在的页中,该符号后面的内容都被推到下一页去
使用分页符能保证前后页格式一致
但注意和分节符区分开,分节符会重新开启“第一页”,例如页脚重新编号
摘要页末尾使用分页符,可保证摘要页始终只有摘要、无论怎么删改,后面的内容不会到本页来
论文标题
格式:基于xxx模型/算法的xxx问题研究 |
xxx模型就是正文里的核心模型
xxx问题就是赛题的中心词
不要使用过多的修饰词
简明扼要、符合规范、便于检索
尽量使用大家都知道的词语
避免出现公式、非公知公用的缩写
字数限制在一行内
摘要
基本要求
摘要是对论文的高度概括总结。
让评阅老师读完摘要,就知道本文解决的问题、建立的模型和求解结果。
注意事项
不要加图或表格
控制在3/4页到一页,字数大约800~1100
开头段: 本文针对XXX问题,通过建立XXX模型,实现对XXX的求解。
针对问题一,考虑XXX,建立XXX模型/利用XXX方法,...求解出XXX。
针对问题二,考虑XXX,建立XXX模型/利用XXX方法,...求解出XXX。
针对问题三,考虑XXX,建立XXX模型/利用XXX方法,...求解出XXX。
总结:总结全文,继而分析下你用的模型的优点,自夸一下。
关键词:主要模型/算法,或出现频率高的、体现论文针对的问题的词
开头段模板:
本文主要研究了XXX问题。根据XXX,利用XXX模型/方法,求解出XXX
第一句: 说清研究的问题
第二句: 说清全文采用的模型/算法、采取的操作
开头段不要写求解结果
示例: 17年国赛A题
本文主要研究了CT系统参数标定与成像问题。根据CT系统成像原理,利用radon变换、傅立叶变换等方法,对CT系统进行参数标定,完成了未知介质的成像并进行了去噪处理,最后分析了参数标定的精度和稳定性并设计了新的用于参数标定的模板。
中间段模板:
针对问题一,考虑/根据XXX,建立XXX模型/利用XXX方法,...求解出XXX
一定要写清结果!
优化类、预测类和物理类的题目,要明确写清数值
要求提供建议或评价的题目,写要明确写清结论和数据依据,但不要有表格: 数据过多可说明数据见附录
示例: 17年国赛A题
针对问题二和问题三,根据数字图像处理技术和滤波器原理,利用不同空域特征的区域对应着频率平面中的不同区域的特点,在已知接收信息的情况下,利用傅立叶变换即可求得被测物体的吸收率、性状和位置等信息。根据CT系统正方形托盘的几何信息,可求得附件中10个点的位置对应的吸收率,依次为-0.0757;-0.0325; -0.0380; -0.0015; 1.9827: 0.0023;0.0131; 0.0125; -0.0204; 0.0297。
摘要总结段:
如果写完后摘要超过一页了,可以不写
不要累赘重复前面写过的内容
写一些本文的特色、自夸的语句
示例: 17年国赛A题
定价模型考虑了会员密集程度、任务集中度、 任务难易程度等因素。任务优化分配模型提高了任务的有效完成率,基于最大流的启发式算法计算精度高、运算时间短等优点,高效解决了拍照任务定价问题。
示例: 16年国赛B题
本文的特色在于将机理分析与多目标规划相结合,运用熵权法将多目标问题转化为单目标问题,使得求解结果更加客观。此外,对于解空间较复杂的模型,设计了变步长搜索算法,在保证了求解的精度的同时,极大地提高了运算的时间复杂程度,为日后系泊系统的设计的发展提供了参考依据。
摘要关键词:
关键词一般4~6个
使用的模型和算法、大家都知道的专业名词、问题的关键词
中间以空格分开
示例: 16年国赛A题
系泊系统设计 多元非线性方程组 循环遍历法 层次分析法 优化模型系泊系统设计 机理分析 最小二乘法 变步长搜索算法
系泊系统设计 刚体力学方程组 多重搜索算法 多目标优化系泊系统设计 受力分析 悬链线 控制模型 多目标优化 遗传算法
公式编辑
- Word自带公式编辑(适合小白)
- Mathpix (神器,付费)
- AxMath (推荐,付费)
- Latex不适合小白
- MathType问题较多,不推荐
公式、图和表格都要记得标号
图片绘制
基本要求
展示思路,形象地展现结果,提高逼格
图的标题要放在下方,且带有编号 (表上图下)
注意排版,要无首行缩进,居中对齐
常见作图软件
最简单: PPT、Excle、AxGlyph、 Origin、visio
编程类: Python、 MATLAB、 SPSS
专业类: COMSOL (物理) 、CAD (工程制图) 、Maplnfo (地理信息)
非学术类: ProcessOn、亿图、Xmind
万能神器: ECharts ,由JavaScript实现的开源可视化库,功能齐全
MATLAB足够解决一切!
对于小白:有图最好,但如果做不出来,也不必刻意为了作图而去作图。
流程图、思路图:
展示对问题的分析、模型或算法的思路
Excel、PPT: 或者ProcessOn、亿图、Xmind
函数关系图:
常用Excel、MATLAB、AxGlyph、Origin; 注意不同曲线颜色设置不一样,带图例
整体背景白底黑线
物理示意图:
展示物理模型
常用PPT、MATLAB、visio,或AxGlyph、 COMSOL
物理模型图一般不必要
地理空间图:
涉及空间分布等
MapInfo、FineBl软件; Echarts开源可视化库;或者Excel做好的宏包
糟糕的图:截图里包括多余内容,模糊不清(反而会扣分)