【全网独创首发】2024美赛C题30页质量参考论文+Q1-Q4完整解题代码数据集配套+保姆级答疑服务

2024 MCM 问题 C: 网球中的势能 (文末获取)

题目翻译:

在2023年温布尔登男子单打决赛,20岁的西班牙新星卡洛斯·阿尔卡拉兹击败了36岁的诺瓦克·德约科维奇。这场失利是德约科维奇自2013年以来在温布尔登的首次失利,也结束了这位网球史上最伟大的选手之一在大满贯赛事中的惊人连胜。 这场比赛本身就是一场惊心动魄的战斗。德约科维奇似乎注定要轻松获胜,因为他在第一盘就以6-1的比分占据了优势(赢得了7局中的6局)。

然而,第二盘却是一场紧张的对决,最终由阿尔卡拉兹在抢七中以7-6的比分获胜。第三盘则是第一盘的逆转,阿尔卡拉兹轻松以6-1的比分获胜。这位年轻的西班牙人似乎在第四盘开始时完全控制了局面,但不知怎么的,比赛又发生了转变,德约科维奇完全掌握了主动,以6-3的比分赢得了这一盘。第五盘和最后一盘开始时,德约科维奇带着第四盘的优势,但又一次发生了变化,阿尔卡拉兹获得了控制权和胜利,以6-4的比分结束了比赛。

这场比赛的数据在提供的数据集中,“match_id”为“2023-wimbledon-1701”。

你可以看到第一盘的所有得分,当时德约科维奇占据了优势,使用“set_no”列等于1。比赛中发生的令人难以置信的波动,有时是为了多个得分甚至是多个局,使得一位选手似乎具有优势的现象通常被归因于“势能”。

  • 势能的一种字典定义是“运动或一系列事件所产生的力量或力量”
  • 在体育运动中,一支球队或一名球员可能会感觉到他们在比赛/比赛中拥有势能,或者“力量/力量”,但很难衡量这种现象。此外,还不清楚比赛中的各种事件是如何创造或改变势能的(如果存在的话)。
  • 这里提供了所有2023年温布尔登男子单打比赛的每个得分数据,这些比赛是在前两轮之后进行的。你可以根据自己的判断选择包括其他球员信息或其他数据,但你必须完全记录数据来源。

使用数据来解决如下问题:

  • 开发一个能够捕捉比赛中随着得分发生的比赛流程的模型,并将其应用于一个或多个比赛。你的模型应该能够识别在比赛中的某个时刻哪位球员表现更好,以及他们表现得有多好。提供一个基于你的模型的可视化,来描述比赛流程。注意:在网球中,发球方赢得得分/局的概率要高得多。你可能希望以某种方式将这一因素纳入你的模型中。
  • 一位网球教练对“势能”在比赛中起到任何作用持怀疑态度。相反,他认为比赛中的波动和一方球员的连续成功是随机的。使用你的模型/指标来评估这一说法。
  • 教练们很想知道是否有一些指标可以帮助确定比赛的流程何时即将从有利于一方球员转变为有利于另一方球员。
    • 使用至少一场比赛提供的数据,开发能够预测比赛中这些波动的模型。哪些因素似乎最相关?(若有的话)?
    • 鉴于过去比赛中“势能”波动的差异,你如何建议一位球员在与不同的球员进行新的比赛时做好准备?
  • 在另一场或多场比赛上测试你开发的模型。你预测比赛中的波动有多好?如果模型在某些时候表现不佳,你能否找出可能需要在未来的模型中包括的一些因素?你的模型对其他比赛(如女子比赛)、锦标赛、球场表面和其他运动(如乒乓球)有多大的普适性?
  • 用不超过25页的报告呈现你的发现,并包括一份一到两页的备忘录,总结你的结果,并为教练提供关于“势能”的作用以及如何准备球员在网球比赛中应对影响比赛流程的事件的建议。

注意:对于一个完整的MCM提交,没有特定的最低页数要求。你可以使用最多25页的空间来展示你的解决方案和任何你想要包括的额外信息(例如:图画、图表、计算、表格)。接受部分解决方案。我们允许谨慎地使用AI,如ChatGPT,尽管不需要使用AI来解决这个问题。如果你选择使用生成式AI,你必须遵守COMAP的AI使用政策。这将导致你必须在你的PDF解决方案文件的末尾添加一个额外的AI使用报告,这不计入你的解决方案的25页的总页数。

提供的文件:

  • Wimbledon_featured_matches.csv – 2023年温布尔登男子单打第二轮后的比赛数据集。
  • data_dictionary.csv – 数据集的描述。
  • data_examples – 帮助理解提供的数据的例子。

术语表

大满贯:网球中的大满贯是指在一年内在一个项目中赢得四个主要冠军的成就。四个大满贯锦标赛是澳大利亚公开赛、法国公开赛、温布尔登和美国公开赛,每个锦标赛都持续两周。

术语表中的关键术语/概念:

  • 计分:
  • 比赛:五盘三胜制(温布尔登男子单打比赛)
  • 盘:一组局;6局赢得一盘,但球员必须领先两局,直到盘分达到6-6时
  • 局分计算:
  • 0分 = Love
  • 1分 = 15
  • 2分 = 30
  • 3分 = 40
  • 平分 = All(例如,“30 all”)
  • 40 – 40 = Deuce(球员赢得相同的分数,至少各3分)
  • 发球方赢得平分 = Ad-in(或“advantage in”)
  • 接发球方赢得平分 = Ad-out
  • 发球:球员轮流在每一局担任“发球方”(即打出每一分的第一球的球员)和“接发球方”。在职业网球中,发球方往往有很大的优势。每一分,球员有两次发球的机会(将球打入“发球区”)。如果两次发球都没有打入,就是“双误”,接发球方就赢得这一分。
  • 破发 - 当接发球方赢得一局。
  • 破发点 - 如果接发球方赢得这一分,他们就会赢得这一局。
  • 保发 - 当发球方赢得这一局。
  • 抢七局:每一盘在一个球员赢得6局的情况下结束,只要他们领先至少两局(例如,6 - 4)。如果没有,比赛就继续进行,直到达到6 - 6的平局。此时,就要打抢七局。在温布尔登,抢七局是先得7分(必须领先两分)赢得,除了比赛的第五盘,是先得10分(必须领先两分)赢得。
  • 休息/换场:比赛开始后,第一局结束时选手交换场地,之后每两局交换一次。从第三局开始,每次换场时允许休息90秒。在抢七局中,每六分交换一次场地。每盘结束后,选手至少休息2分钟。比赛中允许一次医疗暂停和一次如厕。

问题重述:

题目的关键信息如下:

  • 题目的背景是2023年温网男单决赛,西班牙新星阿尔卡拉兹击败了德约科维奇,这场比赛出现了多次势头的转换,有时被称为“势头”。
  • 题目的目的是使用提供的数据,建立一个模型来捕捉比赛的流程,分析“势头”的存在与否,预测比赛的转折点,以及给教练提供一些建议。
  • 题目的要求是:
    • 开发一个模型,能够识别哪个选手在比赛中表现更好,以及他们的优势有多大,并提供一个可视化的方式来展示比赛的流程。
    • 使用模型来评估一个教练的观点,他认为“势头”在比赛中没有任何作用,比赛的波动是随机的。
    • 使用至少一场比赛的数据,开发一个模型,能够预测比赛的转折点,即哪些事件会导致比赛的流程从一个选手转向另一个选手,并分析哪些因素与之相关。
    • 测试模型在其他比赛中的表现,评估模型的准确性和泛化性,以及模型是否适用于其他比赛(如女单)、其他锦标赛、其他场地和其他运动(如乒乓球)。
    • 产生一个不超过25页的报告,包含模型的发现和结论,并包含一个一到两页的备忘录,总结模型的结果,并给教练提供一些关于“势头”的作用,以及如何训练选手应对比赛中影响比赛流程的事件的建议。报告还应包含一个摘要页、目录、参考文献和AI使用报告(如果使用了AI的话)。

对文章的问题进行解释:

  • 你需要根据2023年温网男单决赛的数据,建立一个数学模型,来分析和预测网球比赛中的“势头”现象,即比赛中选手的优势和劣势的变化。
  • 你需要用你的模型来回答以下问题:
    • 如何用图形的方式表示比赛的流程,以及哪个选手在什么时候占据上风?
    • “势头”是否真的存在,还是只是随机的波动?
    • 有没有什么指标或因素可以帮助判断比赛的流程即将发生转变?
    • 你的模型在其他比赛中是否有效,是否可以推广到其他情况?

赛题分析

背景:网球比赛中的动量问题,即比赛中选手的优势和劣势的变化,以及影响比赛流程的事件。

难点:主要在于理解网球比赛中的很多相关概念。以及如何量化和捕捉动量的概念,如何判断比赛的转折点,以及如何评估动量的影响因素。

对上述网球比赛相关概念的通俗解释如下:

  • 比赛:网球比赛分为多个,每个盘由多个组成。在温布尔登男子单打比赛中,每个比赛由五个盘组成,谁先赢得三个盘就赢得了比赛。
  • :每个盘由六个局组成,但是必须要有两个局的差距才能赢得盘。如果双方打成6-6平局,就要进行抢七,即谁先得到7分(并且有两分的差距)就赢得了盘。在温布尔登比赛中,第五盘的抢七要求是谁先得到10分(并且有两分的差距)。
  • :每个局由多个组成,每个分的得分方式是:0分(Love)、15分、30分、40分。如果双方都得到40分,就称为平分(Deuce),此时必须要有两分的差距才能赢得局。如果发球方赢得了平分后的第一分,就称为优势发球(Ad-in),如果接球方赢得了平分后的第一分,就称为优势接球(Ad-out)。
  • 发球:每个局由一方轮流发球,发球方有两次发球机会,如果两次都发球失误,就称为双误(Double Fault),对方就得到一分。在网球中,发球方通常有较大的优势,因为他们可以控制球的速度和方向。
  • 破发:当接球方赢得了一个局,就称为破发(Breaking Serve)。如果接球方有机会赢得一个局,就称为破发点(Break Point)。如果发球方赢得了一个局,就称为保发(Holding Serve)。
  • 换场:每个局结束后,双方要换场,即从对方的场地转到自己的场地。在第一局结束后,以及之后每两个局结束后,双方要换场。换场时可以休息90秒。在抢七中,每六分后要换场。每个盘结束后,双方要休息至少两分钟。双方可以申请医疗暂停和一次洗手间休息。

重点:如何建立一个合理的数学模型,能够反映比赛的流程,分析动量的存在与否,预测比赛的转折点,以及给教练提供一些建议。

可能需要应用的数学模型

    • 评价模型:可以用一些评价指标,如得分率、破发率、发球速度等,来衡量选手的表现,以及用一些综合评价方法,如层次分析法、TOPSIS法等,来比较选手的优势和劣势。
    • 预测模型:可以用一些预测方法,如时间序列分析、灰色预测法、马尔可夫预测等,来预测比赛的走势,以及用一些判别方法,如逻辑回归、支持向量机等,来判断比赛的转折点。
    • 分类模型:可以用一些分类方法,如聚类分析、决策树、神经网络等,来分析比赛中的不同阶段,以及用一些关联分析方法,如Apriori算法、PageRank算法等,来分析比赛中的影响因素。
    • 优化模型:可以用一些优化方法,如线性规划、非线性规划、多目标规划等,来优化选手的策略,以及用一些模拟方法,如蒙特卡罗法、遗传算法等,来模拟比赛的可能结果。


对题目数据集的解读:

Examples to Help Understand the Data Set部分是用来说明数据集中的各个列的含义和如何解读的。

  • 27
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值