2020年美赛D题思路与反思

前言

提交完论文后瘫了两天,总结一下这次的比赛叭。作为一个对建模刚接触半年的小白参加这次美赛是对自己的提升;
在出题后一脸懵逼??ADE三个题,两个没数据,一个数据怎么这样多?!还好之前学习了机器学习的部分知识加上对python的熟悉(主要我是足球狗),我力排众议选了D题,比赛期间队友全程一脸懵逼(我怀疑到现在他们都不知道做了什么),所以对于一个初次接触建模的小白来说在这个比赛中做了主建模+编程手顺带写部分论文(emmm),总之这次比赛对自己提升很多。

思路分析及算法思路

对于这道题,选这道题的同学应该深有体会,这数据。。。太多太杂,不过还好在题目下,官方给出了参考文献,顺道在谷歌学术又爬了几篇,大致有了想法,知网也有,推荐一篇:“社会网络分析法研究足球比赛传球表现的可行性分析_李博”,对于这道题目关键和难点也是对网络的分析以及对球队战略进行评估。
比完赛问了些同学,有开始的时候被这个建立网络坑了,有人做成了图像处理,导致最后代码过于庞大,于是弃赛。

pro1

其实所谓的分析,可以理解为指标的量化。图有很多性质,我列举一些比如:稳健性,最短路径等,对于这些分析还好之前把图论过了一遍:
1.稳健性:跟据我们小学时候所学的三角形具有稳定性,当然在图网络中可以判断三角形的数目来判断这个图网络的稳定性,所用到的算法即常见的动态规划算法即寻找图网络中三角形网络的数目;
2.最短路径:判断最短路径时可以用到Dijkstra算法来寻找传球之间的最短路径,
时间为 在这里插入图片描述
3.中介中心性:是分析图网络的另一个重要指标。在图论中,这可衡量一个节点位于通往其他节点的路径上的程度,通过中介中心性可以判断这些球员在球场上扮演着重要的角色,因为将他们从网络中删除可以使团队从高绩效变成低绩效。
这样分析第一问算是完成,可以分析出球队的大致战术和网络结构(二元?三元)
仿照论文中我们也画出来很多比赛的传球网络图不一一列举,就发一个在球场上的传递的吧(networkx这个包很好用,建议看看他的api);
在这里插入图片描述

pro2

对于第二问,我首先看了官方推荐的那几篇论文,在谷歌学术上又找了几篇相关推荐的,其中几篇给我们了很好的思路;
当然第二问有很多人有疑问,对于这么多个的数据,我们是分析一场比赛的好,还是分析全部的比赛好,当时我也决定分析全部比赛的没必要(但是到第四问又分析了全部的,真香);
当然我在第二问时没有分析别的因素而是只分析了,图网络的一些特征,当然分析方法也很简单,聚类分析:我们分析了度中心性,中间性中心性,紧密性中心性,特征向量中心性,聚类系数等指标,
这些特征也可以表示一些比赛时的团队东西,举个例子:Degree Centraliy表示球员在比赛中的参与度,这些可以发散的去思考,当然你们有好的思路也可以,我的小白仅供参考。
这些东西得到后,第二问也就迎刃而解,通过这些指标可以分析战略是否普遍有效,对对手的反战略的执行效率。代码方面网上有很多现成资料,可以作为写法的参考;

pro3

个人认为第三问最**,在第三问是正了八经的分析战术,作为一个足球狗,战术可以理解为:阵型+策略。
做到这一问的时候是第二天晚上,然后我就去玩了一晚上的FIFA18【狗头】(因为有大佬认出来这个是17-18的埃弗顿),我模拟了一下不同阵容对赛季积分的影响(不考虑转会);
当然评价一个战术的有效性和时效性可以从传统的方面进行分析比如控球率,射门/射正、扑救、抢断等等,根据fullevents里面我们找到了14个评判指标,有人可能会问,why?为什么分析这个。举个例子:我们比赛中控球率低战术的执行率自然也就低也就影响比赛结果;
分析时我们自然采用了主成分分析(经典),很自然的得到了前几个最影响的因素;再聚类分析这几个;当然我们自然没有错过对比赛时的网络的分析,分析了每个球员接球传球的位置画出热点图,可以直观的展现球员在场上的活动情况,分析时用了DTW方法,因为实际中我们遇到相位的长度是可变、确定空间上相似的相位问题。
通过球员的平均出现的位置我们也可推出阵容是什么,还单独分析了几位相对活跃的球员在比赛中的跑位,这样得到打法策略战术就很直接,当然提建议是我们放在最后面说的,在回答第三问的这块时候文字建模了一下;

pro4

首先,百度名词,在题干里有跟社会挂钩的名词,那么也明白了我的模型要从球场出去回到社会,企业。去分析这些地方的和足球相似的地方,还需要了解哪方面因素对比赛的影响,很简单回归实际,在足球团团中往往会出现很多的其他因素来影响团队和比赛,毕竟足球是圆的嘛,裁判的判罚尺度及偏袒程度(写到这一个萨米很抱歉),球队中的精英数目(这个不解释),球队的抗压能力(欧冠呜呜呜,我哭了)等。这些反映到社会上也很容易联想到,企业中团队精英数目,社会弹性恢复力等等。
这块我们分析了38场,分析球队球员位置的变化,进行相似聚类并深化优化网络,对这个全部比赛进行分析,得到评判指标,名字我们起的就不分享(可能不专业),得到战术越有效即比赛比分或其他指标很出色,评判指标越高。
剩下的就是吹模型了,这个题也就收工了。

反思

因为是第一次参加建模,可以说给我一个下马威,由于线上做题团队沟通不是很方便,我的思想论文手无法理解,可能是我表达能力问题,我只能编写代码边码论文;
还有一个很重要,对友们要熟悉再熟悉,写论文的一定要懂建模;
对于出题后不要急于定方案,而是要先查文献再订方案,我的队友没有方案只能我定,我就犯了这个错误,导致第一版方案被自己否了(第一晚在崩溃的边缘),第二天查了文献才找到了代码感觉,最后完成题目;
还有个人建议以后组队就是编程手一定要有算法基础还有不要局限于matlab可以发展到python、R,本来以为这次比赛就写个代码谁知道。。比完赛也就画了句号,总结提升吧。

本文写的较快,文中的分析如有疏漏请批评指正,谢谢,如有大佬对这个题又自己更好的想法可以讨论共同提升

ps:代码和细节等出成绩后出详细的讲解(咕咕咕)【代码语解释句+python数据处理部分知识】

summary: In this paper, we establish a regression model based on the passing network to evaluate the influence of team structure strategy and opponents’ counter-strategy on the match results. Fortask1,wefirstlistsomeHuskiesmatchstatisticsforthisseasonandanalyzetheteamin brief. Secondly, we construct a passingnetwork based on the number of passes and visualizes the passing network diagram of three games under three different coaches. We use these three diagrams to describe and compare the changes in Huskies’ strategies. After that, we identify network patterns of dyadic and triadic configurations and count 15 kinds of these two configurations in the above three matches, reflecting the structural indicators of the passing network. We also explore time scale and micro scale by giving the change of the team’s centroid over time in the first match and the Huskies’ 4 positions heat map over the season. For task 2, we construct the regression model not only introducing the basic data representing Huskies’ and opponents’ ability, but also extracting six independent variables from the indicators of the passing network into the model. Considering opponents’ counter-strategies, we also introduce the product interaction term between opponents’ data and network structure indicators. Through the training of regression model, we can judge whether the independent variables introduced have influence, what kind of influence and how much influence the independent variables introduced have on the result of the match. For task 3, by bringing in data for training, the model leaves 10 variables including interactionterms. Inordertoverifytheaccuracyofthemodel,weuseLeaveOneOutcrossvalidation, andthepredictedaccuracyoftheraceresultreached71.05%. Then,basedonthetrainedmodel, we point out the effective structural strategies Huskies currently have, such as the strong connection between the core players. Meanwhile, we also give specific advice for Huskies team to improve team success, such as the emphasis on triadic configurations among players. Fortask4,weextendthemodelappliedtohuskiestoallteamworkscenariosandintroduce the IPOI model. The IPOI model conducts multi-level induction of influencing factors and selection of assessment indicators from the four aspects of team input, process, output and reinput, taking into account team construction, operation, management, feedback and other aspects. WeconsiderthattheexistingHuskiemodelisprogresspartofIPOImodel,andweadd the evaluation system of input, output and reinput part, taking the university scientific research team modeling as an example. Insummary,ourmodelispracticalandreliableforhandlingnetwork-basedteamworkproblems in society. Keywords: football strategy, network science, regression analysis, IPOI model.
### 回答1: 2020美国数学建模竞赛C是关于船舶重载的问。该问要求我们确定什么样的载重量将导致船只的深度过浅,进而导致拖底的风险。这个问的复杂性在于,船只在运行过程中,其深度会随着载重量而改变,因此我们需要建立一个模型来描述这个过程。 为了解决这个问,我们可以从以下几个方面入手: 1. 建立数学模型:我们可以通过建立一个差分方程组来描述船只载重量与其深度的关系,并利用数值方法进行求解。 2. 数据预处理:我们需要对数据进行预处理,通过对数据进行清洗、归一化和特征选择等操作,提取出与问相关的因素进行分析。 3. 团队合作:团队成员间需要协作,分工合作,互相协调,才能较好地解决问。 4. 结果分析:通过对模型结果进行分析,确定哪些载重量将导致船只的深度过浅,因此需要采取相应的措施,避免拖底风险。 综上所述,2020美国数学建模竞赛C是一道较为复杂的问,需要团队成员之间的高度配合和优秀的数学建模技能。可以通过逐步分析和细致的工作流程来解决这个问。 ### 回答2: 2020美赛C是一道关于高峰时段公共交通的问。此的主要目标是优化传统的公共交通服务,以适应庞大的工作人口在高峰时段的需求,同时保持交通流量的稳定性和可行性。 在此中,我们需要综合考虑如何在给定的路线网络上配置公交车辆、确定站点位置、调度行车、管理乘客等问。这个问可以分成四个方面来分析: 首先,我们考虑如何确定站点。我们需要分类考虑不同地点的出行量,然后提取出来加入站点网络。其中,我们可以利用聚类算法和可行性算法来确定站点位置。 对于较为密集的区域,我们需要根据聚集程度放置多个站点;对于出行量较低的地区,我们可以简化站点网络,以节省成本。 其次,我们考虑如何配置车辆。在给定的路线网络中,我们需要选择最优路线,以将车辆需要的时间缩短到最小。选择均衡的路线还可以缓解拥挤现象。可以通过遗传算法等优化方法实现车辆的最优配置。 第三,我们需要描述如何管理乘客。在高峰期内,人流量较大,需要有效利用公共交通系统以缓解人口拥堵,坚持手动调度选定道路运输模式,并对乘客进行治理。我们需要通过社交力量将乘客引导至正确的入口和出口,以使人流更加平衡。同时,我们需要建立合理的乘客数量控制机制,以防止超载、过度拥挤等问。 最后,我们考虑如何评估策略的有效性。评估公共交通服务的质量通常是使用客流量和时间延迟这两个指标。我们可以使用相关的统计和机器学习方法来预测和评估公共交通服务的质量,从而更好地改善系统服务质量。 综上所述,本需要综合考虑各种因素,如工作人口、路线网络、车辆配置、乘客管理和策略评估等等,最终得出一个高峰时段公共交通的优化方案。 ### 回答3: 2020美赛C是一道关于最优化和建模的目。该涉及到拓扑结构的优化,即如何使得一个网络连接的节点之间的传输距离最短,从而降低传输时间和成本。 建模过程中,首先需要根据目中的数据生成网络的拓扑结构图,并将节点之间的距离作为变量。然后,需要使用数学和优化理论来构建目标函数,并确定约束条件。其中,目标函数是为了最小化网络中节点之间的相对距离,以实现传输路线更短的目的。而约束条件则包括了每个节点至少需要连接一条边、所有边的总数量以及节点之间不能出现环等限制条件。 接下来,需要选择合适的算法进行求解。常见的算法有贪心算法、动态规划算法、启发式搜索算法等。对于本来说,需要考虑采用带有约束的非线性规划算法来求解最优解。 最后,需要对求解结果进行分析和解释,提取有价值的信息和结论。可以从网络拓扑结构的角度出发,分析网络的稳定性、可靠性以及传输效率等方面的因素,从而帮助用户优化网络设计和管理。
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值