2025年数学建模美赛(MCM)C题阅读与思考

Problem C: Models for Olympic Medal Tables

一、题目阅读

在 2024 年巴黎夏季奥运会期间,除了观看各个单项赛事外,粉丝们还关注着每个国家的总体 “奖牌榜”。最终结果(表 1)显示,美国获得的奖牌总数最多(126 枚),中国和美国以 40 枚金牌并列金牌榜首位。主办国法国在金牌数排名中位列第 5(16 枚),但在奖牌总数排名中位列第 4,而英国以 14 枚金牌排名第 7,在奖牌总数上排名第 3。

金牌银牌铜牌总数
美国404442126
中国40272491
日本20121345
澳大利亚18191653
法国16262264
荷兰1571234
英国14222965

表 1:2024 年巴黎奥运会最终奖牌榜 - 金牌榜前 7 名国家

奖牌榜前列的排名总是备受关注,但其他国家的奖牌数也同样重要。例如,阿尔巴尼亚(2 枚奖牌)、佛得角、多米尼克和圣卢西亚(均为 2 枚奖牌)在巴黎奥运会上赢得了本国的首枚奥运奖牌。多米尼克和圣卢西亚在本届奥运会上还各自获得了一枚金牌。目前仍有 60 多个国家尚未赢得过奥运奖牌。

人们通常会对奥运会最终奖牌数进行预测,但一般不是基于历史奖牌数,而是在临近即将举行的奥运会、确定了参赛运动员名单时进行预测(例如:Nielsen's Gracenote Expects USA, China, Great Britain, France and Australia to Lead 2024 Paris Olympic Games Medal Table | Nielsen)。

题目提供了所有夏季奥运会的奖牌榜数据、主办国信息,以及每届夏季奥运会按运动项目细分的赛事数量。此外,还提供了所有奥运参赛选手的个人数据,包括他们参加的项目和比赛结果(奖牌类型或未获奖)。你的模型和数据分析必须仅使用提供的数据集。你可以使用其他资源来提供背景和上下文信息,或帮助解释结果(务必记录资料来源)。具体而言,利用提供的数据:

  • 为每个国家建立奖牌数模型(至少包括金牌数和奖牌总数)。包括对模型预测的不确定性 / 精度的估计,以及衡量模型表现的指标。
    • 根据你的模型,对 2028 年美国洛杉矶夏季奥运会的奖牌榜有何预测?给出所有结果的预测区间。你认为哪些国家最有可能取得进步?哪些国家会比 2024 年表现更差?
    • 你的模型应包括尚未获得奖牌的国家;你预测有多少个国家将在下一届奥运会上获得首枚奖牌?你对这一估计的可信度如何?
    • 你的模型还应考虑特定奥运会的赛事(数量和类型)。探究赛事与各国获得奖牌数量之间的关系。哪些运动项目对不同国家最为重要?原因是什么?主办国选择的赛事对比赛结果有何影响?
  • 运动员可能代表不同国家参赛,但由于公民身份要求,他们更换国籍并不容易。然而,教练可以轻松地从一个国家转到另一个国家,因为教练执教无需拥有该国国籍。因此,可能存在 “优秀教练” 效应。例如郎平,她曾带领美国和中国的排球队获得冠军;还有颇具争议的体操教练贝拉・卡罗利,他先后执教罗马尼亚和美国女子体操队并取得巨大成功。分析数据,寻找可能归因于 “优秀教练” 效应的变化。你估计这种效应在奖牌数上的贡献有多大?选择三个国家,确定他们应该考虑聘请 “优秀” 教练的运动项目,并估计其影响。
  • 你的模型还揭示了哪些关于奥运会奖牌数的独到见解?解释这些见解如何为各国奥委会提供参考。

二、题目思路(这里仅简单分析,后续会给出详细的代码和解决方案)

  • 建立奖牌数模型
    • 数据预处理:仔细阅读数据字典,明确各数据字段含义。针对运动员数据集中部分运动项目 “Team” 字段的特殊情况,制定统一的处理规则,比如对于德国沙滩排球队的 “Germany - 1”,可统一提取国家信息 “德国”。处理可能存在的记录异常值,对于缺失值,根据数据特点选择合适的填充方法,如均值填充、基于其他相关数据的回归预测填充等。
    • 特征选择与提取:从提供的数据集中提取与奖牌数相关的特征。考虑国家的历史奖牌数,可按时间序列分析各国不同年份的奖牌获得趋势,计算过去几届奥运会的奖牌数均值、中位数、标准差等统计量。结合主办国信息,构建虚拟变量,标记各国是否为主办国,研究主办国身份对奖牌数的影响。纳入奥运会赛事数量和项目类型信息,分析不同项目数量变化与各国奖牌数的相关性,将项目按热门、冷门等分类,转化为分类变量用于建模。
    • 模型选择:对于预测各国的金牌数和奖牌总数,可尝试多种模型。线性回归模型,以历史奖牌数、赛事数量等为自变量,建立线性回归方程预测奖牌数,通过最小二乘法求解模型参数。时间序列模型,如 ARIMA 模型,对各国历史奖牌数时间序列进行平稳性检验,根据检验结果确定模型参数,利用模型预测未来奖牌数。机器学习模型,像随机森林、支持向量机回归等,对数据进行特征工程后,划分训练集和测试集,使用训练集训练模型,通过交叉验证优化模型参数,在测试集上评估模型性能。
    • 模型评估与不确定性估计:采用多种指标评估模型性能,如均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)等,衡量预测值与实际值的偏差程度。使用交叉验证方法,如 K 折交叉验证,多次重复训练和评估模型,得到更稳定的性能指标。通过 Bootstrap 抽样多次重复构建模型,计算预测结果的置信区间,估计模型预测的不确定性。
  • 预测 2028 年洛杉矶奥运会奖牌榜
    • 模型应用:将处理好的 2028 年相关数据(如预计的赛事数量、各国参赛运动员信息等)输入到训练好且性能最佳的模型中,得到各国金牌数和奖牌总数的预测值。
    • 确定预测区间:根据之前计算的置信区间,为每个国家的预测结果确定相应的预测区间,以反映预测的不确定性。
    • 分析国家表现变化:对比 2024 年和 2028 年预测结果,计算各国奖牌数的变化量,找出奖牌数增加最多的国家,分析其在相关运动项目上的发展趋势、投入情况等,判断其进步原因;对于奖牌数减少的国家,同样分析相关因素,如运动员状态下滑、项目竞争加剧等。
  • 预测未获奖国家获得首枚奖牌情况
    • 建立预测模型:从未获得奖牌国家的历史参赛数据中提取特征,如参赛次数、参赛项目分布等,结合赛事信息,使用逻辑回归、决策树等分类模型,预测每个未获奖国家在下一届奥运会获得首枚奖牌的概率。
    • 估计数量和可信度:根据预测概率,设定一个阈值(如 0.5),统计超过阈值的国家数量,作为获得首枚奖牌国家的预测数量。通过模型在验证集上的准确率、召回率等指标,评估预测的可信度,同时可以使用 ROC 曲线下面积(AUC)来综合衡量模型的性能。
  • 探究赛事与奖牌数关系
    • 相关性分析:计算各国在不同项目上的奖牌数与该项目赛事数量的皮尔逊相关系数,找出相关性较高的项目,分析其原因,比如热门项目可能参赛国家多、竞争激烈,获奖机会也相对较多;冷门项目虽然参赛国家少,但可能技术门槛高,部分国家具有独特优势。
    • 重要项目分析:对于每个国家,统计其在不同项目上获得的奖牌总数占比,占比高的项目即为对该国重要的项目。分析这些项目对该国重要的原因,如该国在该项目上具有传统优势,拥有优秀的运动员培养体系;或者该项目在国内普及度高,群众基础好。
    • 主办国赛事影响:对比主办国在举办奥运会前后相关项目的奖牌数变化,分析主办国选择的赛事是否对本国奖牌数有促进作用。研究主办国在新增项目或重点推广项目上的表现,探究其背后的原因,如主办国在筹备过程中加大了对相关项目的投入,提高了运动员的训练水平。
  • 分析 “优秀教练” 效应
    • 数据筛选与整理:从运动员和奖牌数数据集中筛选出有教练变动且涉及不同国家的相关数据,比如找到郎平执教中美两国排球队期间的比赛数据,贝拉・卡罗利执教罗马尼亚和美国女子体操队期间的对应数据。
    • 对比分析:对比教练变动前后各国在相关项目上的奖牌数变化,计算奖牌数的增长率或变化量,评估教练对奖牌数的影响。例如,计算郎平执教美国女排前后美国女排的奖牌数变化,以及执教中国女排前后中国女排的奖牌数变化。
    • 选择国家与项目:选择三个具有代表性的国家,如在某些项目上有提升空间但目前奖牌数较少的国家。分析各国在不同项目上的发展现状和潜力,确定适合聘请 “优秀教练” 的项目。通过假设聘请优秀教练后,参考类似项目在其他国家因教练变动带来的奖牌数变化,结合该国自身的资源投入、运动员基础等因素,估计聘请优秀教练对奖牌数的影响。
  • 挖掘独到见解与提供建议
    • 总结见解:从模型结果和分析过程中总结关于奥运会奖牌数的独特发现,如某些国家在特定项目上的奖牌数增长呈现周期性规律;不同地区国家在不同类型项目上的优势分布特点等。
    • 提供建议:根据总结的见解,为各国奥委会提供针对性的建议。对于奖牌数增长呈现周期性规律的国家,建议合理安排训练和参赛计划,在周期上升阶段加大投入;对于在某些项目上有潜力但缺乏优势的国家,建议学习其他国家在该项目上的成功经验,引进优秀教练或技术;对于尚未获得奖牌的国家,建议分析自身优势,选择合适的项目重点发展,逐步积累经验和实力。
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值