2017年数模国赛B题第一小题的思路过程(个人思路)

在这里插入图片描述

第一题.简单来讲,就是给了一些数据,让我们拟合回归方程.

这是附件一的数据(任务相关数据)
在这里插入图片描述
这是附件二的数据(会员相关数据,会员即执行任务的人)
在这里插入图片描述
用excel地图将两类数据可视化.

  • 任务数据
  • 颜色为是否完成,高低为任务标价

在这里插入图片描述

  • 会员数据

在这里插入图片描述
先对图分析一下,能注意到这些问题:

  • 任务主要分布在四个城市,东莞深圳广州佛山
  • 东莞完成度很高,深圳完成度很低
  • 会员有挺多离群数据点

我们小组成员总结出的两个附件的一些影响因子:

  • 任务的位置:
    1.任务可能以四个城市为主,离城市越远,价格越贵.
    2.任务可能由于聚集的原因,任务聚集越多,可能就越?其实这个说不定,可能会因为聚集,抢的人多就便宜了,也可能任务太多,人不够,所以价格就贵了.

  • 会员的位置,人越多的地方,可能任务的价格就越低

  • 会员的完成任务能力,将会员里的剩余三组数据定义为会员完成任务的能力.不然影响因素可能就太多了.

然后逐个分析四个影响因素:

  • 任务距离城市中心的距离:还是比较容易想到聚类算法的,得到四类中心,然后由于数据比较集中,可以将这些数据点视作在一个平面上.然后每个点与中心点的欧式聚类一算就搞定了.

在这里插入图片描述

在这里插入图片描述

  • 任务聚集度:这个问题参考了一些优秀论文.两个方法叭,一个是以1.5km画圆,圈住任务个数就是密集度了.不过想起来容易…实施起来很多细节…比如1.5km怎么算…最后我们使用了另外一个方法,单纯划分成5050的格子.从min经度到max经度划分,纬度同理.格子里面有几个任务就是多少密集度.论文可能还要分析一下这个5050的格子实际为多大,是否合理.
    在这里插入图片描述

  • 会员密集度,与任务聚集度同理.不过筛掉那些离得太远的离群点.

在这里插入图片描述

  • 完成能力里面,又有三个因素.综合成一个因素的话.那就使用熵权法一股脑堆在一起叭.三类数据熵权,堆起来,得到一个数据.这里也不太好数据可视化.

四个因素分析完了,得到值了,那就使用多元回归分析进行拟合.得到数据,这里可以用excel也可以用python sklearn.

在这里插入图片描述

这个数据是经过归一化后的系数,也可以不归一化,方便预测.然后R^2为0.28,低的离谱…拟合的真的很差.
在这里插入图片描述
可以看到价钱贵的都没拟合到.那怎么办呢?翻了翻优秀论文,再添加一个因素,任务的难易度.这个在附件里面没有体现…但大胆假设,为啥会有这么大误差,因为还有一个影响因子,任务的难易程度.这之间的差值,就是任务的难易程度的划分.那怎么划分难度呢?对残差聚类分析…得到四个中心点,就是四个等级.

在这里插入图片描述
在这里插入图片描述

(上面的文字和数据不对应,要排序一下)

最后拟合的结果,那肯定是相当好,这么一顿操作下来,我觉得我就是硬拟合…醉了,加上了难度系数的拟合就必不可能拟合的不好了…
在这里插入图片描述
(说点题外话,写到这我在翻代码时,发现我用于残差计算的预测值,不是四影响因子的预测值,是原先三个影响因子的预测值.心态有点蹦,好多图要重做了)

最后,对自己的做法评论一下…就离谱,拟合就硬拟,系数啥的离谱的要死.有种过拟合的意思.有个地方可以稍稍改正一下,就是等级里面会有负的,级低等级扣钱的现象出现,其实可以将前面多元回归方程的数字借一下,借给等级,这样子拟合出来的方程好看一些(因为原数据的最低价格就是65,拟合出来的常数偏大,正好借给难度,可以让难度表现为,难度越难就需要加钱,简单的不加钱,或只加一点钱.然后难度可以四舍五入一下…小数点太多有点硬拟合的感觉)

  • 关于第二题的看法.虽然已经用光了所有的数据,但是其实还是又改进的地方,那就是,东莞和深圳的完成情况.深圳完成的比较好,东莞完成的比较差.为什么呢?优秀论文提到的,两地GDP不同,深圳有钱,不差这点钱懒得做.东莞学生和家庭主妇多一些,喜欢赚这种钱,而且gdp相对落后…这样加入gdp,进一步完成模型.不过这样第一问的第二小问解释的空间就比较小了,也可以匀几个因素过去第二题…
  • 感受,优秀论文成为优秀论文,我觉得并不是因为整篇都很优秀,而是在某个点上很有亮点同时,整体比较自洽.但是…看论文的时候不能全信,因为比赛时时间太紧,不可能每个方面都很完美,有的地方实在解释不通,很有可能就是糊弄过去的…所以读优秀论文时多思考一下,不要被优秀论文牵着鼻子走

我也是数模新生小白,以上就是对2017年国赛B题第一问的一些思路…如果有谬误或者更好的思路,欢迎指正,感激不尽!

  • 17
    点赞
  • 67
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
数学建模优秀论文 本节主要讲解数学建模竞赛应该如何准备以及分工的问。很多新来的学生 都会问我这个问,数学建模好难、我不会建模、我数学底子很差。其实,我觉 得由于从小学到高中的教育,很容易把数学建模等同于数学竞赛。这两者其实真 的天差地别,如果说数学竞赛更多的是一种智力的比拼,那么数学建模更多的是 一共系统与工程协调的比拼。粗俗点说,前者就是做,后者则是科研。 数学建模主要分为三个方向,建模,编程,以及写作。我们通常看到数学建 模证书上面有三个人的名字 xxx,xxx,xxx。如果按照传统思想排队,一般第一 个人负责建模,第二个人负责编程,第三个人负责写作。其实三个人在队伍中的 地位是平等的,所以国奖证书很人性化地把大家的名字都排在自己队伍的第一位。 下面具体说说建模、编程以及写作。 建模主要是需要构建出一个数学模型,这个模型可以是一组方程,可以是一 个可操作的框架,也可以是一个函数。总而言之,能用数学解决问的一种抽象 方法,就是数学模型。我们高中学的物理,在解物理过程,其实就是数学建 模的过程。比如 2016 年国赛 A 第一问,只要用到高中物理的正交分解法, 列出水平方向以及竖直方向的精力平衡,即可解决该问。我想,大家都是考上 本科的人了,最基础的物理还是会的吧?所以对于建模的同学来说,并不要求你 的数学功底有多么的好,但是需要你在培训或者自学期间,多涉猎一些模型(不 求计算或者推导,只求能有一定的印象,只要这个模型应该用在什么地方即可。) 这样,到了真正比赛的时候,想到用什么方法,结合网络等资源便可以迅速学习 出相关的模型理论,经过自己的一定创新,便可以较好地解决所需要完成的任务。 编程这一块是韩同学的强项。我只谈谈作为建模为主,但是要懂一些编程的 人应该达到的编程水平。严格来说,写 MATLAB 代码还做不到完全脱离书本的水 平。但是我已经具备了看到一大段代码,自己对其中的部分语句进行修改,为我 所用,实现自己想要的功能。对于建模比赛来说,达到这种水平一般来说是够用 了,只要在编程同学写程序的时候,建模的同学可以检查 MATLAB 代码是否符合 数学模型的要求,而不是单纯的代码堆积。如果是计算机或者软件方向的学生, 那么就尽可能地多学习 MATLAB 有关知识,能够自己独立写出代码并且调试错误 那么是再好不过的了。 写作这一块是专门为文科生或者女生准备的福利,其实不管你的模型多么华 丽,不管你的程序复杂度多么地低,如果无法形成一篇语句流畅,图文并茂的论 文出来。你还是只有拿成功参赛奖的命。如果说建模与编程的同学决定了获奖的 11 上限,那么写作的同学则决定了获奖的下限。一篇排版以及语句优秀的论文,可 以让评委老师眼前一亮,迅速获得好评。在国赛中,由于不放心论文,所以两次 论文写作均是我个人操刀,其实两次论文都存在一定的遗憾。如果有一位细心的 女同学可以帮助另外两名队友写作并且细心排版,那么论文的水平将会更上一层 楼。同时,我希望写作的队员不要完全不顾数学,在比赛期间,还是应该或多或 少知道一些建模以及编程人的思路,即使提不出什么意见,也有助于清晰写作的 框架。 上面为不同方向的队员应该是怎样的以及如何准备。而且我建议三名小组成 员最好是从大一一直打到大四的比赛,只有磨合默契的队友,才更有希望冲击国 奖甚至国一。 四、 数学建模竞赛比赛技巧 既然这是谈建模竞赛,那么我还是需要谈一谈应试技巧的话,对于代做或 者直接抄袭他人作品的行为我是十分反对的(不能以身试法,否则不仅损害个人 名誉,损害学弟学妹参赛资格,更加损害学校的声誉)。 1.选机灵点,在选前,建议先上知网等学术网站对相关话进行查找, 如果相关文献较多,那么则更容易从中获得灵感,建立出属于自己的模 型(如果用到了里面的公式或者模型,一定要引用)。不过这种做法存在 一个缺点,就是你这么想,难道别人不会这么想么?所以,最终大家的 论文虽然都是各自独立完成的,但是很容易出现结果差不多,图表差不 多,甚至模型差不多的情况。因此,这样很难分出优劣,对于拿国奖来 说,并不是十分有利。(一般国赛 A 多为这种情况,如果想通过原创冲 击国奖,那么更应该选择可塑性高的问,如 B )。 2.如要冲击国奖最好选择可塑性高的,一般每年国赛的 B ,都是方案 类问,即使你在知网或者其他网站上找到相似的文献,但是仔细一看, 往往都是失望而归。因为 B 一般都是热点问:比如去年的互联网+打 车和今年的小区道路改造问,都是以往不曾出现过的。所以,如果 B 你可以挖掘出别人挖掘不到的信息,并且建立出一个较为新颖的模型, 那么国一就是你的了。 3.一定要把第一做对(做不对也要给出一个结果)!一定要写一篇较为完 整、格式较为清晰(哪怕只做了一问,也有文章)的论文。如果可以达 到上述要求,那么不论是什么建模比赛,奖状都有你的一份了。。。。但是 很遗憾,每年不管什么类型的比赛,很多同学连这一条也无法达到,所 以同学们应该反思自己,为什么拿不到奖了。 4.对于得不出较为理想的值,则应该从现在所做的所有工作中选一个数据 出来作为答案,并且附上理由。千万不要无端造出程序无法实现的答案 出来,如果万一进了国奖答辩,评委问你这个数据怎么得出来的,你总 不可以说是猜出来的吧? 5.每一次比赛,都认真做,不要总想着还有下一次的比赛可以做,做好每 一次的比赛,都是一次不错的锻炼。 6.写作的同学可以参考往届优秀论文,尤其以广西赛区的优秀论文为主, 学习他人的写作方式,这样可以让自己的论文风格,论文框架,论文排 版均接近国奖论文的素养。 12 7.编程的同学如果想使用他人的程序时,不妨学会其思想,自己设计新算 法并且实现功能。而且对于复杂的程序,最好在论文中附上一个程序框 图,方便评委老师理解。 8.建模的同学应该多多涉猎不同的文献,中文的,外文的最好都阅读以下, 然后自己在草稿纸上画一些思维导图,对这些文献之间的关系进行一定 的梳理,然后结合本问分析,看看什么地方需要修改,什么地方需要 精简,什么地方需要补充等等。而且,建模的同学一定要尽量把模型程 序化,用一些编程同学听得懂的话进行沟通。比如我把今年 A 第一问 从物理受力问变成了迭代求解问,这样编程的同学则会舒服很多 数学建模参考的书目以及网站 书籍 1.《 数学模型》姜启源等著 阅读人群:建模 这本书虽然被奉为数学建模最经典的入门书,但是我本人并不是十分喜欢。 第一,这本书的模型比较杂,而且可操作性较差。意思就是说,告诉你了理论, 你很难再实践中自己去操作。而且很多模型较为基础,对于短期内学习达到国赛 的强度难度较大,因此适合作为一本辅助参考性读物进行学习。如果,你要一个 字一个字读下去,会发现到头来还是什么都不太会(除了暑期培训的时候阅读过, 之后再也没有使用过了) 。 2.《数学建模算法与应用》司守奎等 阅读人群:建模、编程 是我最为推崇的书:《数学建模算法与应用》。这本书是司守奎老师写的新书, 司老师是数模一线教练,经常培养出国一国二。因此他的书与国赛风味十分贴近, 很多问都是取自国赛,而且附上了所有程序的源代码,那本书中的光盘则 收入了所有程序的 m 文件(MATLAB 的源文件),实属业界良心(都省去了你抄源 代码的时间)。所以,这本书是可以用来临时抱佛脚的,如果你的目标就是在省 赛区取得一定的名次,那么这本书真的足够你用了(基本上每次比赛,我首先查 阅的必定是这本书)。 3.《数学建模》Frank R. Giordano 等著 叶其孝等译 阅读人群:建模 这本书是美赛负责人写的书,实际上我阅读这本书也觉得没有多大的意思, 和姜启源那本数学模型类似,不适合一页页阅读,更加适合提高建模的修养,但 是不适合用来准备数学建模国赛或者美赛。所以,如果你想要参加美赛,那么建 议你还是稍微看看,毕竟是美赛指定的参考书。 4.《 MATLAB 在数学建模中的应用》卓金武等著 阅读人群:编程 这本书和司守奎老师的那本书风格有点接近,例基本选于国赛,但是 这本书对于模型的介绍较少,主要都是给出 MATLAB 代码,每一章最后都有延伸 阅读,因此对于 MATLAB 感兴趣的同学可以将这本以及下一本作为入门参考书。 5. 《MATLAB R2014a 完全自学一本通》刘浩等著 阅读人群:编程 这本书是一本 MATLAB 工具书,并不完全针对数学建模,但是很多 MATLAB 使 用的小技巧都来自于这本书,比如今年我们画的锚链形状图,均来自这本书的灵 感。 6.《 20XX 年全国大学生数学建模竞赛广西赛区经验交流及优秀论文选》吕跃进 著 阅读人群:写作(最为重要)建模(参考) 编程(参考) 13 作为广西赛区优秀论文集,写作的同学尤其需要注意,广西赛区的优秀论文 都是长什么样子的?我们不需要先想着和其他赛区的人比,先学习自己赛区的人 的论文,可以让自己的起步稍微简单一些。XX 的意思就是某某年,一般从 20102015 年的左右参考下即可。 7.《全国各赛区优秀论文》 阅读人群:写作 建模 编程 当你学有余力时,不妨多看看其他省份优秀论文,找找差距,找到一个提高 建模水平的方向。 8.《正确写作美国大学生数学建模竞赛论文》&《美国大学生数学建模竞赛解 析与研究》 王杰等著 阅读人群:建模 写作 这两本书作为美赛官方读物,非常适合美赛冲刺前 2 个月阅读,由于这套书 并没有给出源程序,因此只有写作以及建模的同学进行参考。尤其是《正确写作 美国大学生数学建模竞赛论文》这本书,非常适合写作的同学学习,其中有一些 写作习惯甚至可以用于国赛的写作中去。这本书还有一个特色就是讲解了部分有 关使用 LaTeX 的知识。 9.《 SPSS 统计分析基础教程》&《SPSS 统计分析高级教程》张文彤等著 阅读人 群:编程 这两本书手把手地教你如何使用 SPSS 分析数据,加上 SPSS 本身“傻瓜式” 设计,因此配合这两本书进行一定的学习足够了。 10.《 Origin9.1 科技绘图与数据分析》叶卫平著 阅读人群:编程 建模 如果在短时间之内学会一个软件并且可以进行比赛,那么 Origin 绝对是一 个利器。基本上涉及绘图的问,大多数 MATLAB 可以完成的,它也可以完成。 几乎与 SPSS 一样的“傻瓜式”设计,非常适合初学者学习掌握。所以我认为建 模的同学多学一个绘图的软件也没有什么不好的(我们美赛的灵感出自这本书) 。 上面 10 本书希望绝大多数同学都可以涉猎一二,即使是枯燥的数学模型那 本书,最好也稍微看看,好歹有一些印象。而司老师那本书,我则希望人手一本。 下面的书籍由于时间成本还有与建模的关系不是那么紧密,所以参考即可。 11.《 SAS 统计分析实用宝典》 姚鑫峰等著 阅读人群:编程 作为最为专业统计软件 SAS,对于处理大数据问的时候,是当仁不让的王 者,连 MATLAB 都要为其让路。如果你十分热衷于大数据的问,还有想参加“汇 丰杯”SAS 数据分析大赛的同学,或者参加阿里巴巴天池大数据竞赛的同学不妨 以这本书作为基础,学习 SAS 吧。 12.《 R 语言实战》Robert I. Kabacoff 著 高涛译 阅读人群:编程 作为 SAS 的姊妹,R 语言作为免费开源的数据分析软件同样大受欢迎,如果 你不喜欢昂贵的 SAS,那么投入 R 的怀抱也不错。 13.《物理学原理在工程技术中的应用》马文蔚等著 阅读人群:建模(尤其喜欢 A 的同学) 本来是不太想把物理类的专业书引入到数学建模竞赛中来,无奈自从 2014 年开始,每年国赛 A 的问都是物理问(可以认为是纯物理问),2014 年, 卫星变轨问(万有引力与航天)。2015 年,利用杆子的太阳影子定位(球面天 文学与地球物理学)2016 年,系泊系统的设计(力平衡与力矩平衡) 。所以天知 道 2017 年 A 会出什么样奇怪的问。这本书有助于大家对于物理在工程上的 应用有一定的认识,以作为知识储备。 14. 《MATLAB 神经网络 43 个案例分析》 王小川等著 阅读人群:编程 最近几年比赛中,智能算法越来越多地出现在本科生的比赛中了,如果你想 14 在国赛或者美赛中使用一些新鲜的算法,那么还是学习这本书中的一些案例吧。 这本书的源程序全部都给你了,只需要对着程序一步步推敲,一定可以学到一些 知识(我们“好贷杯”模型的灵感出自这本书)。 15. 《机器学习》周志华著 阅读人群:建模 由于这个领域现在属于热门领域,因此数模的很大一部分未来的研究方向皆 在于此。我本人对于这个领域也处于学习当中。当然,你想要看懂这本书,还是 先学好概率论与数理统计,线性代数,和部分微积分的知识吧。 网站 1.数学中国论坛:www.madio.net 作为中国最大的数模论坛网站,你可以找到很多奇奇怪怪的数模资料,当然 我还是劝你先学好上面 10 本书之内的东西,因为其实一个人的精力并没有那 么多。 (实际上,我参加数学中国的比赛,很少用体力去上面下载什么资料) 。 2.LaTeX 中国区论坛:www.ctex.org 你想知道的 LaTeX 资料,上面都有。 3.中国知网:www.cnki.net 维普:www.cpvip.com 万方:www.wanfang.com.cn 这三家为中国主流的文献数据库,基本上大多数中文期刊可以找到。 4.由于 Google 学术在中国区无法使用,因此只能使用 Bing 学术搜索外文文献 了:http://cn.bing.com/academic 5.赛氪网:www.saikr.com 作为 APMCM 和 Mathorcup 的主办方,赛氪还是其他很多比赛的报名渠道。不 经意间往往可以发现更多适合自己的竞赛。 6.COMAP:www.comap.com 美赛官方网站,由于美赛是一个只发放电子证书的比赛,因此了解他家官网 还是很有必要的。 7.阿里巴巴天池大数据竞赛:http://tianchi.shuju.aliyun.com 作为数模后续竞赛,对于大三或者大四等高年级的同学,欢迎转战更加具有 实用性质的数据分析竞赛。 8.MATLAB 中文论坛:http://www.ilovematlab.cn 有啥问就丢上去问就行了。 9.人大经济论坛:http://bbs.pinggu.org/ SAS,SPSS 等统计类的问,在这个论坛上找出相关的目录,进去发问就好了。 这个论坛是我国经管类最好的论坛。
对于2023数学建模国赛B,我可以给出一些思路供参考。请注意,以下仅为一种可能的解方向,具体问要求还需要进一步分析和理解。 首先,需要明确B的具体内容和背景信息。然后,可以从以下几个方面来思考解思路: 1. 问分析:先对目进行整体分析,确定问的核心要求和目标。理解目中给出的各种条件和要求,明确所需要解决的具体问。 2. 数据处理:如果目给出了相关的数据,需要对数据进行合理的处理和分析。可以利用图表、统计学方法、数据挖掘等手段来分析数据的规律和特征。 3. 建立数学模型:根据目要求,寻找合适的数学模型来描述问。可以考虑利用概率论、统计学、图论、优化方法等数学工具来建立模型。同时也要考虑模型的合理性和可行性。 4. 求解和验证:根据建立的数学模型,利用适当的算法和计算工具进行求解。在求解过程中,需要进行有效的验证和检验,确保结果的正确性和可靠性。 5. 结果分析:对求解得到的结果进行分析和解释。结合具体问的实际背景,给出合理的结论和建议。 这些是解的一般思路,具体的目还需要根据实际情况进行具体的分析和处理。希望这些思路能为您提供一些帮助。如果需要更具体的解思路或有其他问,请提供更多的背景信息,我将尽力提供帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

rglkt

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值