一、问题描述
在工业革命之前,大气中的二氧化碳(CO2)浓度稳定在约280ppm(百万分率)。至2004年3月,大气中二氧化碳浓度达到了377.7ppm,标志着当时10年间最大的增长幅度。根据美国国家海洋和大气管理局(NOAA)以及斯克里普斯海洋研究所(SIO)的科学家们的报告,2022年5月,月平均二氧化碳浓度峰值达到了421ppm。经济合作与发展组织(OECD)的一份报告显示,预计到2050年,二氧化碳水平将达到685ppm。
《今日科学》杂志编辑部要求你们团队分析并评估当前报道及未来预测的二氧化碳浓度水平的准确性。他们提供了两组数据集(CO2数据集1和温度数据集2),以协助你们的研究。
要求如下:
1、您是否同意有关二氧化碳浓度水平的说法?使用CO2数据集1分析二氧化碳的变化。
a. 您是否认同2004年3月的二氧化碳增加量比以往任何10年间的增长都要大?请说明理由。
b. 根据数据拟合多种数学模型,描述过去并预测未来大气中二氧化碳的浓度水平。
c. 利用每种模型预测2100年时大气中二氧化碳的浓度。是否有任一模型预测结果与声称的2050年达到685ppm的二氧化碳浓度水平相符?若到2050年还未达到该水平,您的模型预测何时会达到685ppm?
d. 您认为哪种模型最为精确?为什么?
2、温度与二氧化碳之间有何关系?许多科学家认为全球气温升高与大气中二氧化碳浓度之间存在关联。使用第一部分的工作成果和温度数据集2来帮助比较陆地海洋温度与二氧化碳浓度水平之间的联系。
a. 构建一个模型预测未来陆地海洋温度变化。相对于1951年至1980年的基准期,您的模型预测何时陆地海洋平均温度将分别上升1.25°C、1.50°C和2°C?
b. 构建一个模型分析自1959年以来二氧化碳浓度与陆地海洋温度之间的关系,并解释这种关系或证明二者间不存在关系的理由。
c. 将第二部分b中构建的模型扩展至未来。您的模型在多远的未来内是可靠的?对于模型预测未来二氧化碳浓度水平和/或陆地海洋温度的能力,您有哪些关注点?
3、为《今日科学》撰写一篇非技术性文章(最多1页),阐述团队的研究发现和对未来可能的建议。
由以上部分可以得出,问题二主要分为以下两个小问:
a、构建一个模型分析自1959年以来二氧化碳浓度与陆地海洋温度之间的相关性;
b、构建一个模型预测未来陆地-海洋温度变化,有哪些考虑因素;
O奖获得者团队的研究思路如下:
a、在相关性分析部分,研究团队收集了从1959年开始的相关数据,创建了陆地-海洋温度与二氧化碳浓度的散点图,直观展现两者随时间的变化趋势及其相互关系。之后应用了皮尔逊相关系数计算方法,得出了这两个变量间相关性。
b、在未来陆地-海洋温度变化预测部分,研究团队首先根据二氧化碳与温度的强相关性,构建两种单变量模型。一是参照问题一中最优的指数模型(二氧化碳与温度间强相关),选择了以时间为自变量建立指数模型来预测未来温度变化。二是以二氧化碳浓度作为自变量,以温度为响应变量构造一元线性回归模型进行预测。
接着,团队进一步意识到仅仅依靠单一的二氧化碳浓度并不能完全解释和预测陆地-海洋温度变化,因此他们扩展了模型,构建了一个多元线性回归模型。在这个模型中,除了考虑二氧化碳之外,还纳入了其他几个关键影响因子,如温室气体(包括甲烷和一氧化二氮)、气溶胶、太阳辐射、燃料燃烧等。
总之,O奖获得者团队在解决这个问题时,采取了严谨的数据驱动方法,从单一变量模型出发,逐步过渡到考虑多元影响因素的复杂模型
一、相关性分析
为了深入确定二氧化碳与温度的关系,研究者不仅通过散点图,相关系数揭示两者之间的联系,还构建了一个以二氧化碳浓度为解释变量的陆地-海洋温度的线性回归进行分析。
研究团队收集了从1959年至2021年的相关数据,制作了一张陆地-海洋温度与CO2浓度的散点图。
散点图生动展示了陆地-海洋温度与二氧化碳浓度的分布情况,清晰揭示了随着二氧化碳浓度的增加,陆地-海洋温度也同步上升的趋势。
运用皮尔逊相关系数分析陆地-海洋温度与大气中CO2浓度的关系。该系数旨在测量两个连续变量之间线性关系的强度和方向。皮尔逊相关系数的取值范围介于-1到1之间,越接近1表示正相关性越强,越接近-1则表示负相关性越强,而接近0则意味着几乎无相关性。
通过对1959年至2021年的数据集进行计算,计算得出的皮尔逊相关系数r值为0.9613,这是一个极高值,落在了0.8至1.0之间,表明陆地-海洋温度与二氧化碳浓度之间存在极为强烈的正相关关系。
基于这样的高度相关性,团队构建了一个简单的线性模型,其中陆地-海洋温度作为响应变量,而二氧化碳浓度作为解释变量。通过使用1959年至2021年的数据集训练模型,得到了线性回归方程。
该模型的统计学指标表现出良好的性能,如R²为0.9241,F统计量为753.0363,P值小于0.000,这意味着二氧化碳浓度与陆地-海洋温度关系显著且有效【问题2b】。
二、未来陆地-海洋温度变化预测
研究者分别建立以时间为自变量的指数模型、以二氧化碳浓度作为自变量的一元线性回归以及多元线性回归模型来对未来陆地-海洋温度变化进行预测。
选取时间t作为独立变量,将陆地-海洋温度T设为因变量,建立了指数增长模型。并用1959年至2021年的历史数据对该模型进行了训练。
为了处理数据量级问题,研究团队对时间变量t进行了归一化处理,计算得到指数模型。
这个模型的拟合度指标相当出色,具体表现为:
R²(决定系数)为0.9184,意味着模型解释变量的变异中有91.84%可以由该指数函数解释;
RMSE(均方根误差)为0.0922,表示模型预测值与实际观测值的平均差异较小;
MAE(平均绝对误差)为0.0811,反映模型预测值的平均偏离程度较低;
MRE(相对误差平均值)为0.7484,体现模型预测的相对偏差控制得较好。
模型的拟合结果和预测误差图形化展示在右图中,以便直观地观察残差情况。
此外,通过此指数模型预测了不同陆地-海洋温度阈值的达到时间点。1.25℃、1.5℃和2℃的升温水平预计将在2028年、2036年和2048年到来【问题2a】。
在问题一中得到了二氧化碳浓度的预测模型。因此,研究者考虑,利用问题一成果可以得到二氧化碳浓度的预测值,再考虑到二氧化碳浓度和陆地海洋温度的强相关性,进而建立二氧化碳和陆地海洋温度的关系式,从而对陆地海洋温度进行预测。该模型既是二氧化碳浓度和陆地海洋温度相关性的补充,又是后续多元回归预测模型的铺垫。
该模型的R²为0.9241,F统计量为753.0363,P值小于0.000,这意味着模型对数据的拟合效果显著。
随后,团队借助该线性模型预测了未来温度达到特定升温阈值(如1.25℃、1.5℃和2℃)的预期时间点。预测结果显示,这些温度将在2030年、2038年和2051年出现,与之前基于指数模型预测的时间节点非常接近。
经过分析发现,单纯使用线性模型进行长期预测时存在不合理性,因为它无法准确描述非线性的气候系统动态,尤其在线性模型预测至2200年时,气温的上升趋势不切实际地高估到了30℃,这显然不符合真实世界的气候演变规律。
因此,团队进一步考虑了多元分析方法,基于一系列与气候密切相关的因素构建了一个多元线性回归模型。这些因素包括:总太阳能辐射强度(RFsolar)、化石燃料燃烧产生的热量及温室气体排放(RFfuel)、地球反射、气溶胶对辐射的影响(RFaerosol)等。
为了消除多重共线性问题,团队还利用主成分分析等统计技术对影响因子进行处理,确保模型的有效性和稳定性。最终确定的因素为总太阳能辐射强度(RFsolar)、化石燃料燃烧产生的热量及温室气体排放(RFfuel)、气溶胶对辐射强迫的影响(RFaerosol)、以及三种主要温室气体——二氧化碳(RFCO2)、甲烷(RFCH4)和一氧化二氮(RFN2O),计算得到多元回归模型。
T代表陆地-海洋温度,α_i为相应的回归系数,RF_x表示不同因子的辐射强迫强度。多元模型的R²为0.8781,相较于仅依赖单一因素(如二氧化碳浓度)的模型,该多元模型能更好地捕捉到气候系统的复杂交互作用。基于此多元模型,团队预测了2050年和2100年的陆地-海洋温度,分别为1.781℃和3.3889℃。
此外,团队还进行了敏感性分析,通过改变二氧化碳水平,分析了其对陆地-海洋温度的影响。结果显示,若在未来二氧化碳浓度增加或减少5%和10%,将分别导致到2100年陆地-海洋温度的显著变化。
资料获取
今天分享就到这里,后续将持续更新优秀论文解析。近20年优秀论文与HIMCM备考软件、资料已备好,需要的小伙伴可关注微信公众“思谋EDU”,添加助理微信免费领取。
78G超全数学建模资料: 历年HIMCM优秀论文——O奖: