华为杯第十九届中国研究生数学建模获奖论文(草原放牧策略研究)

摘要

草原在维护生物多样性、涵养水土、净化空气、固碳、调节水土流失和沙尘暴等方面
具有重要的生态功能。草原上合理的放牧政策是带动区域经济、防止草原沙漠化及保障民
生的关键,现代草地资源的经营应遵循可持续发展原则。本文将围绕锡林郭勒草原放牧优
化问题展开研究,为制定放牧政策和草原管理决策提供科学的依据。

针对问题一:分析附件中 3、4、15 中的数据信息并挖掘其中的信息。首先,把不同
放牧策略即放牧方式、放牧强度定义为自变量。其次,将土壤物理性质中的土壤湿度以及
植被生物量定为因变量,为了简化模型,将放牧方式定为比例系数 M(t)并指定范围区间为
[0,1],借助 Woodward 工具得出放牧策略与植被生物量之间的微分方程。然后,根据土壤-
植被-大气系统的水平衡基本方程并具体分析锡林郭勒草原的地形地势,从而建立放牧强度
与土壤湿度之间的微分方程关系。最后,依据模型可知轻度放牧条件下对植被生长的促进
能力最强,重度放牧则会对植被造成破坏。

针对问题二,根据土壤湿度数据、土壤蒸发数据以及降水等数据,建立模型对保持目
前放牧策略不变情况下对 2022 年、2023 年不同深度土壤湿度进行预测。首先,对数据集
进行清洗和标准化处理。其次,利用 Person 相关性方式计算各特征与土壤湿度的相关性系
数,挑选相关性较强的特征作为模型训练数据。然后,选择线性回归、SVR、LightGBM
等 7 个机器学习模型进行对比分析,选择预测效果最好的 LightGBM 模型,并利用网格搜
索算法找到模型最优参数。最后,利用训练好的模型分别对 2022 年、2023 年不同深度土
壤湿度进行预测。

针对问题三,建立放牧策略对锡林郭勒草原土壤化学性质影响的数学模型,在轻度放
牧的情况下,土壤中的化学生物(有机碳、无机碳、全氮)含量处于适量状态与对照组中
的化学生物含量相差少,有助于植被生长,增加生物多样性。建立模型预测锡林郭勒草原
监测样地(12 个放牧小区)在不同放牧强度下 2022 年土壤同期有机碳、无机碳、全 N、土壤
C/N 比等值。首先,对模型训练数据进行初步探索,主要查看是否存在缺失值和异常值,
并进行对应的数据清洗操作。然后,利用 Person 相关性探索方式剔除相关性较低的特征。
最后,挑选出在本小节问题场景、数据集表现效果最好的 XGBoost 集成学习算法构建土壤
湿度预测模型。

针对问题四:通过分析附件 5、6、8 中的数据,结合沙漠化程度指数预测模型表达式,
最终确定不同放牧强度下监测点的沙漠化程度指数值。分析附件 3、7、14 中的数据,并
结合土壤板结化的定性描述,根据 W、C、O 三个因素的影响程度,来确定三个系数之间
的比例,完成对土壤板结化进行定量定义。最终,根据模型确定在放牧强度为轻度放牧时,
沙漠化程度指数与土壤板结化程度最小。

针对问题五,在保持草原可持续发展情况下,寻找 300mm-1200mm 降水量下实验草场
内放牧羊的最大阈值数量。首先,综合利用沙漠化指数和土壤板结化指数的数值,即保持
草原可持续发展基本策略,构建降水量与沙漠化指数和土壤板结化指数的关系模型。然后,
建立多元目标方程式,并且加入约束规则。最后,利用灰狼算法求解模型最优解,在沙漠
化指数和土壤板结化指数综合值一定的情况下,寻找最大放牧羊阈值。

针对问题六,在示范牧户放牧策略不变的情况下,综合利用附件中关于锡林郭勒草原
土壤湿度、化学性质、植被量值等数据,结合前面几节所建立的模型与放牧策略,利用已
建立好的预测模型对示范区(以 G21 为举例)2023 年 9 月的相关数值进行预测,并存在对
应的文件中。通过寻找最大方差拟合优度(GFV)来确定最优划分类别,使得组内尽量相似,
组间尽量相异,确保不存在特定类别样本数过少而引起的过度分类。

关键词:放牧策略,土壤沙漠化,土壤板结化,相关性分析,LightGBM 算法,XGBoost
算法,网格搜索算法,灰狼算法,评价指标

目录

一、 问题重述 …5
1.1 问题背景…5
1.2 问题的提出…6
二、 模型假设与符号说明…7
2.1 基本假设…7
2.2 符号说明…7
三、 问题一的求解…8
3.1 问题分析及建模思路…8
3.2 数据说明…8
3.3 模型建立…9
3.4 模型求解结果…10
四、 问题二的求解…12
4.1 问题分析及建模思路…12
4.2 数据分析及预处理…12
4.2.1 原始数据集介绍…12
4.2.2 数据预处理…13
4.2.3 土壤蒸发、降水等与土壤湿度的相关性…14
4.3 建立土壤湿度预测模型…18
4.4 模型求解结果…20
五、 问题三的求解…22
5.1 问题分析及建模思路…22
5.2 构建放牧策略与土壤化学性质关系模型…23
5.2.1 数据预处理…23
5.2.2 模型构建…23
5.2.3 模型求解结果…26
5.3 构建土壤成分化学值预测模型…27
5.3.1 数据预处理…27
5.3.2 相关性分析…28
5.3.3 模型构建…28
5.3.4 模型求解结果…29
六、 问题四的求解…31
6.1 问题分析及建模思路…31
6.2 数据分析及预处理…32
6.3 模型建立…34
6.4 模型求解结果…35
七、 问题五的求解…35
7.1 问题分析及建模思路…35
7.2 数据处理…35
7.3 沙漠化、土壤板结化指数与放牧羊数量模型…35
八、 问题六的求解…41
九、 模型评价 …43
9.1 模型优点…43
3
9.2 模型缺点…44
参考文献 …44
附 录 …45

一、问题重述

1.1 问题背景
草原约占全球陆地面积的 25%,也是我国面积最大的陆地生态系统[1],草原在维护生
物多样性、涵养水土、净化空气、固碳、调节水土流失和沙尘暴等方面具有重要的生态功
能。中国的草原面积为 3.55 亿公顷,是世界草原总面积的 6%-8%,居世界第二。
中国草原主要分为温带草原、高寒草原和荒漠草原等类型[2]。内蒙古锡林郭勒草原是
中国四大草原之一,是温带草原中具有代表性和典型性的草原,如图 1-1 所示,主要由荒
漠草原、典型草原和草甸草原组成。锡林郭勒草原在环境保护、碳氮循环、气候调节等方
面发挥着重要的作用,同时也是我国北方牧民赖以生存的基地[3]。锡林郭勒草原不仅是国
家重要的畜牧业生产基地,同时也是重要的绿色生态屏障,在减少沙尘暴和恶劣天气的发
生方面发挥着作用,也是研究生态系统对人类干扰和全球气候变化响应机制的典型区域之
一和国际地圈—生物圈计划(IGBP)陆地样带—中国东北陆地生态系统样带(NECT)的
重要组成部分[4-6]。
在这里插入图片描述

三、问题一的求解

3.1 问题分析及建模思路

问题一要求从机理分析的角度,建立不同放牧策略(放牧方式和放牧强度)对锡林郭
勒草原土壤物理性质(主要是土壤湿度)和植被生物量影响的数学模型。首先我们通过分
析背景材料、扩展阅读中的相关公式、以及附件中的数据信息,提取了与放牧策略、土壤
湿度、植被生物量有关的信息,更清晰的理解放牧策略、土壤湿度、植被生物量之间的自
然关系。

因为我们要针对实际问题建立数学模型,所以需要将实际问题所用到的信息进行抽
象,通过抽象得到的对应参数建立正确的数学模型。首先可以把不同放牧策略即放牧方式、
放牧强度定为自变量,其次将土壤物理性质中的土壤湿度以及植被生物量定为因变量。经
过对扩展阅读的分析以及对文献《放牧强度对荒漠草原植被、土壤及其侵蚀特征的影响》、
《基于水分平衡原理的内蒙古典型草原土壤水动态模型研究》的学习,可以建立自变量与
因变量之间的微分方程组即不同放牧策略对锡林郭勒草原土壤物理性质和植被生物量影
响的数学模型。

3.2 数据说明
放牧方式有五种分别是:全年连续放牧、禁牧、选择划区轮牧、轻度放牧、生长季休
牧,通过对放牧方式相关概念的学习。显然放牧方式与时间有关,可以表达为 M(t)。在材
料中只有附件 14、15 中的数据选择划区轮牧的方式进行实验,除此之外没有更多的数据
显示其他的放牧方式,为了简化模型,该自变量在模型中可作为一个比例系数体现。在这
里我们将 M(t)的取值范围定为[0,1]区间,其中禁牧 M(t)=0,连续放牧 M(t)=1。
放牧强度有四种分别是:对照(NG, 0 羊/天/公顷 )、轻度放牧强度(LGI, 2 羊/
天/公顷 )、中度放牧强度(MGI,4 羊/天/公顷 )、重度放牧强度(HGI,8 羊/天/公顷 ),
同理放牧强度也是时间 t 的函数,可以记作 S(t)。
通过阅读材料,我们不难发现土壤湿度与土壤蒸发量、降水、土壤渗透量以及植被相
关,无人干扰的情况下,土壤-植被-大气系统的水平衡基本方程[11-14]为
在这里插入图片描述
根据附件中的数据信息,锡林郭勒草原地下水埋藏较深多在三、四十米以下,根据研
究当地下水埋深大于 4m 后,河北麦田中毛管上升水对 2m 土壤水分循环的作用很小[15],
则地下水手管上升量对根系层的补给量Gu 可忽略。

具体分析锡林郭勒草原的地形地势,发现这里地势相比其他草原地势更为平坦,但是
降水量和降水强度较少,因此水分的循环绝大多数时候都是通过垂直方向上的水量交换,
故而,在不考虑其它因素的前提下,我们可以将Rin 和Rout视为相等。

草地的植被直接决定放牧的强度,而植被的截流量能最好反映植被的生长能力,依照
递推关系,放牧强度与植被的截流量存在正相关关系。植被截流量与降水量、植被覆盖度、
叶面积指数(LAI)等密切相关。

3.3 模型建立

在这里插入图片描述
在这里插入图片描述
显然土壤湿度与植被截流量紧密相关,上述公式中植被截流量与植被覆盖率成正比。
放牧强度与植被覆盖率有紧密联系,由放牧强度增高引发的草毡表层极度加厚、土壤紧实
度增加和植物对限制性养分供需失调;或由过度放牧引起的地表生物结皮演化及其对降水
的阻滞导致的一壤养分循环速率和效率下降降低了草地的生产服务能力和系统稳定性维
持能力[17],导致植被覆盖率发生变化。从而建立了放牧强度与土壤湿度之间的微分方程
关系。
在这里插入图片描述

四、问题二的求解

4.1 问题分析及建模思路

放牧策略与土壤湿度有着紧密关系,土壤湿度的增加会提高草场植被覆盖率,在良好
的植被覆盖情况下可以适当提高放牧强度来增加放牧收益,符合科学发展的放牧策略需
求,因此,构建土壤湿度预测模型对草原放牧策略研究起积极作用,有利于牧民、当地政
府及时根据预测结果制定合理、科学的放牧策略。

本节需要根据附件 3 土壤湿度数据、附件 4 土壤蒸发数据以及附件 8 中降水等数据,
建立模型对保持目前放牧策略不变情况下对 2022 年、2023 年不同深度土壤湿度进行预测。
首先,将土壤湿度数据、土壤蒸发数据、降水数据依据年份月份对应相连接,生成合成数
据集。其次,对数据进行清洗和转化,去除缺失值、异常值或进行缺失数据填充,因数据
间的数值差异较大,故再对数据进行标准化处理,通过去量纲减小数据差异的影响。然后,
对清洗和转化的数据进行相关性分析,挑选对土壤湿度相关性较强的特征,剔除相关性较
低的特征,减少数据冗余。

特征工程建立完成后,需要建立数学模型对数据进行训练,本节采用对预处理后的数
据集以 8:2 划分训练集、测试集对比模型,挑选出在本小节问题场景、数据集表现效果最
好的 LightGBM 算法构建土壤湿度预测模型,并使用网格搜索对模型进行参数调优,获取
最优参数,得到最优权重、参数的模型,根据评测标准对得到的最优模型进行检验分析。

4.2 数据分析及预处理

附件 3 土壤湿度数据、附件 4 土壤蒸发数据以及附件 8 中降水数据(时间段为 2012
年-2022 年)依据年份月份对应相连接生成合并数据集,因数据采集点的经纬度位置、采
集站点参数等一致,为了减少数据冗余的问题,去掉字段“经度(lon)”、“纬度(lat)”、“站点
号”、“海拔高度(m)”、“平均气温≥35℃的天数”,数据集剩余 31 个特征,如表 4.1 所示。
其中,序号 3-6:10cm 湿度(kg/m2)、40cm 湿度(kg/m2)、100cm 湿度(kg/m2)、200cm 湿度
(kg/m2)为本小节预测目标字段。

在原始数据集中,所有特征都为数值型,分布广且不一致,导致可能存在缺失值和异
常值的问题,故而无法直接进行建模分析。为了改善数据质量、提高后续模型预测结果的
可靠性,对所需数据集进行预处理操作,分为数据清洗(包括填补缺失值、去除离群值)
和数据转换两部分。

(一)数据清洗
数据清洗第一步,通过数据探索性分析统计数据集中缺失值的分布情况,如图 4-1 所
示,本小节所需实验数据并未出现缺失情况,故不做处理。

在这里插入图片描述
数据清洗第二步,为了确保后续预测结果的准确性,训练数据必须符合实际情况,统
计数据缺失值之前去除“月份”、“年份”、“10cm 湿度(kg/m2)”、“40cm 湿度(kg/m2)”、“100cm
湿度(kg/m2)”、“200cm 湿度(kg/m2)”关键字段,通过数据探索性分析中的箱型图统计数据集中异常值的分布情况,如图 4-2 所示,考虑到图的清晰度只列举前六个特征变量的箱型图,“土壤蒸发量(W/m2)”、“土壤蒸发量(mm)”、“植被指数(NDVI)”、“径流量(m3/s)”等 9个特征存在少部分离群的数据点,因此利用公式:平均值± 3*标准差来判断异常值,考虑到土壤蒸发、降水数据具有时序性和季节性,因此采用前值填充、后值填充的方法处理异
常值。

在这里插入图片描述

  • 17
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VIT19980106

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值