备战2024数学建模国赛(模型三十五):支持向量机 优秀案例(一)淡水养殖池塘水华发生及池水自净化研究

 专栏内容(赛前预售价99,比赛期间299): 2024数学建模国赛期间会发布思路、代码和优秀论文。(本专栏达不到国一的水平,适用于有一点点基础冲击省奖的同学,近两年有二十几个国二,但是达不到国一,普遍获得省奖,请勿盲目订阅)

python全套教程(一百篇博客):从新手到掌握使用python,可以对数学建模问题进行建模分析。

35套模型算法(优秀论文示例):马尔科夫模型、遗传算法、逻辑回归、逐步回归、蚁群算法、蒙特卡洛模拟、聚类模型、线性规划、粒子群算法、神经网络、相关系数、灰色预测、灰色关联分析、模糊综合评价、模拟退火、时间序列ARMA、方差分析支持向量机、插值、排队论、拟合模型、微分方程、层次分析法、小波分析、多元回归、图论floyd算法、图论Dijkstra模型、因子分析、动态规划、博弈论、决策树、典型相关分析、元胞自动机、主成分分析、TOPSIS法。

目录

摘要

1 问题的提出

2 问题的分析

3 模型假设

4 符号说明

5 模型建立

6 模型优缺点

7 模型推广

8 参考文献


摘要

        水产养殖是我国农业的重要组成部分,也是当前农村经济的主要增长点之一。本文针对池塘养殖中常见的水华灾害进行分析,探讨了养殖水体水质的影响因素,以及可持续发展生态养殖模式。
        问题一中本文针对四个池塘的八个采样点的不同数据,采用了𝑃𝑒𝑎𝑟𝑠𝑜𝑛相关系数来度量水体、底泥与间隙水中常见主要理化因子之间的关系。发现池水与间隙水、池水与底泥之间理化因子无直接关联,而间隙水与底泥中的理化因子总体上具有较强线性相关性。探究其原因,底泥释放的物质直接作用于间隙水,而对体积庞大的池水影响甚微,池水中理化因子池水中理化因子含量主要受到水生生物吸收与排放、人为调控等因素的影响。
        对于问题二,水体质量可以直接从水体的理化因子指标上体现。本文结合我国地表水环境质量标准,选取了 6 个主要理化指标作为评价因子对池塘水质进行评价。考虑到评价因子的高维性,本文使用了可以探究高维数据特征的投影寻踪模型来进行评价系统的构建,利用基于实数编码的加速遗传算法(𝑅𝐴𝐺𝐴)对模型进行了求解,并将国家标准中不同等级的水体理化指标代入模型,得到在该模型下的水质评级标准。根据该模型可知各池水质处于动态变化,总体而言 2 号和 3 号池的水质较好,1 号池次之,4 号池最差。造成这种现象的主要原因在于养殖池中养殖密度的差异,过高的养殖密度会使水体溶氧降低,饵料、动物排放的废物浓度升高从而引起水质下降。
        关于问题三,由于藻类植物的生长与池水直接相关,故本文仅选择池水的主要理化指标来建立支持向量回归机模型,以刻画池水中理化因子与总藻类密度的关系,得到两者的回归函数参数(见表 7)。而后本文结合傅里叶逼近预测了未来 5 周 1 号池和3 号池将会发生水华,其余两池水质较为乐观。接着我们使用网格搜索的方法逐一确定了水华发生时主要理化因子的波动范围(见表 9)。
        对于问题四,本文对附件 6 的数据进行分析,剔除了部分异常值后,分别建立了两种鱼类体重与身长的指数回归方程,来描述身长与体重的关系。对于鱼类净化效果的研究,本文以鲢鱼为例,在考虑水循环的净化效果的基础上建立了池水种群的差分阻滞增长模型,求解该模型得到投入166.4𝑘𝑔鲢鱼时,在 20 周的演化后总藻类密度稳定在285.49 × 106/𝐿,该方案可以较好地净化池中藻类。接着,本文对该模型的参数进行了敏感性分析,结果表明引入水循环,加之投入166.4𝑘𝑔鲢鱼的生态模式对一号池中藻类的净化效果是较为稳定可靠的。
        对于问题五,本文以 1 号池为例创建生态养殖池,通过查阅相关资料并结合之前的结论,分别投放300𝑘𝑔鱼、500𝑘𝑔虾、500𝑘𝑔蟹,建立起一套鱼、虾、蟹、藻生态养殖模式,以总藻类密度作为指标,利用元胞自动机进行模拟。通过严重水华、一般水华、无水华三种情况的模拟结果可知,该生态系统能够起到很好的净化作用,但对于无水华的情况可能需要投放一定量人工饲料来保证鱼虾蟹类的正常生长。
        最后,本文对模型进行了中肯的评价,并对模型的应用进行了推广。

关键词:水质评价、投影寻踪、支持向量回归机、差分阻滞增长模型、元胞自动机

1 问题的提出


        水华(英文 Algal Blooms 或 Algae Blooms)是由于生活和工农业生产中,大量含有氮、磷、钾元素的废水排入淡水水体,从而引发的藻类大量繁殖的自然现象,是水体富营养化的特征[1]。
        近年来,淡水生态系统水体污染和富营养化程度加剧,作为淡水养殖主要方式之一的池塘养殖毫无疑问也面临着水华的威胁。水华会破坏养殖生态系统,导致养殖对象不同程度死亡,造成巨大经济损失。因此,针对水华现象的研究迫在眉睫,我们拟通过研究淡水养殖池塘主要理化因子、主要浮游生物数据及鱼虾生成等数据分析水华发生的原因,并在水质评价的基础上控制并预测水华的发生,从而最大程度上提高养殖产量,减小环境污染等。并期望通过对水华发生的研究,加强大家环保意识。


2 问题的分析


2.1 问题一的分析
        要求分析水体、底泥与间隙水中常见主要理化因子之间的关系,并分析原因。即探寻鱼塘的上述三种结构两两组合下,各理化指标数值之间的相关程度,并结合水环境相关的知识给出原因。
2.2 问题二的分析
        对四个池塘水体质量进行评价及分类,本文认为应选取合理的指标,并结合地表水环境质量国家标准建立分类和评价模型,以保证模型的准确性。根据国家标准划分 5类标准水质等级,并用其衡量各池塘水质。最后根据四个池塘的水质情况,分析所养殖的动物(虾或鱼)对水体的影响。
2.3 问题三的分析
        建立主要理化因子和常见浮游生物致害密度之间关系的模型,由于与浮游植物直接相关的为池水,本文选择池水的理化指标进行考虑。探究二者关系时,浮游生物量是因变量,理化因子是自变量,考虑沿用问题二中评价水质的指标因子,又由于与浮游植物直接相关的为池水,本文选择池水的理化指标进行考虑。已知 1 号池发生了轻微水华,故而可以据此确定水华发生的浮游生物临界值,通过建立模型预测出各池在一定滞后期内浮游生物的变化情况与临界值相比较,即可预测出各池未来水华发生的情况。对于水华发生时主要理化因子的范围,考虑使用网格搜索方法,通过控制变量来逐一确定各理化因子的变化范围与水华发生的关系。
2.4 问题四的分析
        对于鱼类生长与体重相关模型,应先根据附件 6 的鱼类体重体长数据,绘制散点图并处理异常数据,再由数据分布决定使用何种模型进行拟合。水华现象的产生与藻类的密度具有直接关系,构造一个与 1 号池相同大小的净化池,通过水循环,并放养鲢鱼或鳙鱼来净化藻类,结合生物的繁殖变化,本文建立考虑差分阻滞增长模型来模拟池塘中两种生物的变化过程。
2.5 问题五的分析

        为了构建生态养殖模式,我们需要使水中生物构成一条和谐的生物链,实现池水的自净化,应基于前述问题考虑到多种生物之间具有复杂的捕食和共生关系,且纳入不同区域的水环境之间的相互作用。分析发现常见的方程不容易简单描述,故考虑采用元胞自动机进行模拟,以总藻类密度作为指标,分析各生物生长情况以及对水质的控制情况。


3 模型假设


 假设各养殖池塘的水温、光照条件一致;
 由于附件中所给的理化因子数据量较少,对样本的统计检验难以逼近实际情况,考虑到正态性是自然界中普遍存在特性,故假设池中理化因子值均服从正态分布。
 为简化研究,假设池塘中常见的理化因子指标可以有效地反映浮游植物的生长情况,可作为影响池中浮游植物生长的主要因子。
 假设本题附件中所提供的数据真实可靠,在实验过程中对藻类的生长繁殖无人为影响。

4 符号说明

5 模型建立

根据上表,下面逐个分析水体的三个部分(池水、间隙水和底泥)两两之间相同
理化因子的相关程度。
池水与间隙水:在六个常见主要理化因子的相关系数值均偏小,尽管呈现正相
关,但都低于 0.3,且范围仅介于[0,0.2]之间,表明池水与间隙水的理化因子之间呈现
低度相关。故而可认为,池水与间隙水中理化因子含量并无直接关联,但可能存在一
定关系。
池水与底泥:相关系数呈现的情况与池水和间隙水之间比较时相似,相关系数值介
于[0,0.2]之间,说明池水和底泥的相关性不强,本文认为池水与间隙水中理化因子含量
也没有直接关系,但可能存在一定关系。
间隙水与底泥:与前面两个情况不同,间隙水与底泥的磷酸盐磷和硝态氮含量相
关系数超过了 0.4,总氮和铵态氮含量相关系数达到 0.6,可见两种介质的上述 4 种理
化因子具有较强关联;而我们也注意到,只有总磷和亚硝态氮含量间的相关性较低。
所以总体上来看,间隙水与底泥在常见理化因子之间相关性较大,但总磷和亚硝态氮
例外。
5.1.2 问题 1 结果的原因探究
通过上述研究我们得到了如下结果:间隙水或底泥与池水之间理化因子无直接关
联,而间隙水与底泥中的理化因子总体上具有较强线性相关性,但总磷和亚硝态氮例
外。对于这一结果本文进行了进一步探究。
(1)池水中理化因子含量主要受到水生生物吸收与排放、人为调控等因素的影响,相比起这些活跃因素,底泥的物质释放作用甚微,因此导致池水的理化因子与底

泥、间隙水没有直接联系。
(2)间隙水与底泥之间的磷酸盐磷、总氮、硝态氮、铵态氮相关性较强,原因是
这些是溶解态的物质,较易释放至间隙水中。例如,底泥对硝酸根离子的吸附作用很
小,释放较充分,所以底泥与间隙水的硝酸根离子显著相关。
(3)而关于总磷和亚硝态氮例外的原因:①底泥中总磷含量虽然很大,但磷元素
的释放却少而慢,且磷的释放所受的干扰因素较多,因此大多数磷元素都沉积于底泥
深处未进入间隙水。②间隙水的提取过程中涉及过滤步骤,所以最终间隙水中的总磷
含量只包含了所有溶解态的磷,而原先含有的少量颗粒磷被滤除,致使间隙水中的总
磷含量偏小,与底泥的相关性随之减小[2]。
亚硝酸盐是硝化作用的中间产物,性质极不稳定的,在好氧条件下迅速转化为硝
酸盐[2],所以在水体中的含量较少,因此致使底泥与间隙水中亚硝态氮含量相关性极
低。
5.2 问题二的模型建立与求解
5.2.1 水质指标选取
本文认为评价水质要从污染程度、自净能力和生物承载能力等方面考虑来选取指
标。由于总磷、总氮、化学需氧量 COD(Chemical Oxygen Demand)是无机物和有机
物污染参数;氨氮是水体中主要耗氧物,其含量高会对鱼类及其他水生生物有毒害[3];
溶氧是指示水体自净能力的指标;PH 会直接或间接影响养殖对象的生存和繁殖,所以
综上考虑,我们选取了总磷、总氮、COD、氨氮、溶氧、PH 这 6 个指标来进行水质评
价与分类。
5.2.2 数据预处理
Step1:三次样条插值补全缺失数据。
本文取每个水池中,A、B 两个采样点各理化因子实测值的均值作为各理化因子的
计算值。总磷、总氮、氨氮 15 周的数据可以参考附件一获取。而附件 2 中 COD、溶
氧、PH 的值均是间隔两周采样一次,数据量不足以用于建立合理的模型,因此我们考
虑利用现有数据进行插值以补充数据。
插值方法选用三次样条插值,因为该方法可以很好地保持数据光滑性和连续性,
减少信息量的损失。最终得到的 15 周的全部指标数据请见附录 2。
Step2:数据同趋化。
所选指标中,一些指标属于高优指标,即数值越大越理想,如溶氧;一些指标是
低优指标,即数值越小越理想,如总磷、总氮、氨氮、COD,另外还有 PH 这类值过
低过高均不合理的指标。为处理上述性质不同的指标,正确反映不同作用力的综合结
果,需要做同趋化处理。
假设每个指标含有𝑚个数值,𝑥𝑛𝑒𝑤为一个指标同趋化后的数据,𝑥𝑚𝑎𝑥是该指标的
最大值,𝑥𝑚𝑖𝑛为最小值。对于不同性质指标具有各自计算公式:
(1) 对于高优指标的同趋化采用如下公式:

的;3#池水质整体也比较良好,但仍有个别周劣于Ⅴ类;4#池水质表现最差,没有达
到过Ⅲ类水,且有三分之二的时间段水质劣于Ⅴ类。
5.2.6 问题二结果分析
相较而言 2#和 3#池的水质较好,1#池次之,4#池最差。根据题目附件 5 给出的各
池放养对象和数量,1、2 池是虾池,3、4 池是鱼池,拥有不同养殖对象的池子之间相
比,虾池的水质整体上优于鱼池。注意到虾池的投放量远小于鱼池,所以这一结论应
与投放量有关。放养量多的池子,相应给予的饵料、动物排放的废物以及由此生长出
来的水生植物都会较多,这些因素都将促进水质的下降。此外,鱼类的呼吸作用会消
耗水体中的溶解氧(DO),溶氧下降后 COD 等污染物不易分解,造成水质变差。
再者我们由图 1 观察到 15 周内各池水质不断波动,我们推断这是由于换水、微生
物净化以及水体自净能力造成的。
5.3 问题三的模型建立与求解
对于理化因子和常见浮游植物密度之间关系的研究,由于与浮游植物直接相关的
为池水,本文选择池水的理化指标进行考虑,具体沿用水质评价的 6 个指标,即总
磷、总氮、COD、氨氮、溶氧、PH。而池水中的浮游植物种类繁多,我们以藻类总量
为研究对象进行拟合和分析。
再者考虑到数据呈现的波动性较大,难以采用常规的多元拟合等方法来探究两者
间的关系,而支撑向量回归机(SVR)作为一种机器学习模型,可以通过训练学习来
挖掘数据间深层的关系,故本文考虑采用支撑向量回归机来对理化因子和常见浮游植
物密度进行训练拟合。
5.3.1 支持向量回归机的选择和建立
支持向量回归机是基于支持向量机(SVM)的回归拟合方法[7]。Vapnik 等人在
SVM 分类的基础上引入了ε不敏感损失函数,从而得到了回归型支持向量机。SVM 应
用于回归拟合分析时,旨在寻找一个最优分类面使得所有训练样本离该最优分类面的
误差最小。为了防止过拟合现象的出现,本文使用每组采样点的前 12 个数据(涉及四
个水池 A、B 两采样点,共 96 组)来作为训练样本,其他的数据来检验最优分界面的
拟合度。
设投影到高维特征空间中建立的线性回归函数为:
𝑓(𝑥) = 𝑤𝜑(𝑥) + 𝑏
其中,φ(𝑥) 为非线性映射函数,定义ε为线性不敏感损失函数,它可以忽略真实
值在某个上下范围内的误差,它的解以函数的最小化为特征,确保对偶变量的稀疏性
还可以确保全局最小解的存在和可靠泛化界的优化。通过规划的思想使得误差最小,
然后引入 Largrange 函数,并转化为对偶形式,如下:

 

由上表可见,随着丰足点数值的下降,20 期后藻类总量普遍随之减小,这可能是由
于丰足点减小,即当总藻类密度达到丰足点时,藻类总量的基数比较小,而鲢鱼的基数
较大,使得反馈调节时,藻类在生态系统中处于不利的位置,而始终无法使得种群繁殖
壮大。在实际中,若总藻类的密度过低,则对处于食物链上层的鲢鱼的反馈调节作用是
较高的,故在上表中,抑制因子较低的部分不具有很大现实意义。
另一方面,就抑制因子的变化来看,无论抑制因子是过高或者过低都会使得总藻类
密度增高。这可能是由于抑制因子过低时,对鲢鱼群体的反馈作用减弱,鲢鱼群体增长
的同时导致食物短缺情况的出现,鲢鱼数量因此减少,从而使得藻类得以繁殖。抑制因
子过高时,对鲢鱼群体的限制作用很大,从而使得鲢鱼群体数量在短时间内迅速减少,
藻类密度因而提高。
总而言之,求解差分阻滞增长模型所得结果,即投入166.4𝑘𝑔的鲢鱼,在参数改变
的情况下,20 期的表现较好,最终得到的总藻类密度在(285.5 ± 30) × 106/𝐿内波动,
本文认为在285.5 × 106/𝐿的基数下,30 × 106/𝐿的藻类数量波动对整个池塘的富营养化
而言,其影响较小,故可认为使用水循环,加上投入166.4𝑘𝑔的鲢鱼的方案对池中的藻
类具有较好的控制效果。
5.5 问题五的模型建立与求解
5.5.1 生态养殖模式分析
为了构建生态养殖模式,我们需要使水中生物构成一条和谐的生物链,实现池水
的自净化,防止水华的发生,减少向江河湖海养殖废水的排放。根据相关资料[9]可知,
以虾、鱼、蟹、藻为基础的生态养殖池能够获得很好的效果,在维持水体正常营养的
同时,显著提高了饲料利用率和经济效益。因此本文将以此为基础,在一号池的基础
上构建一个生态养殖池,研究该方法对水体净化的作用。
考虑到多种生物之间具有复杂的捕食和共生关系,且不同区域的水环境之间也会
有相互作用,常见的方程不容易简单描述,故考虑采用元胞自动机进行模拟,以总藻
类密度作为指标,分析虾、鱼、蟹、藻生长情况。
5.5.2 基于元胞自动机的生态养殖模型
元胞自动机(𝐶𝑒𝑙𝑙𝑢𝑙𝑎𝑟 𝐴𝑢𝑡𝑜𝑚𝑎𝑡𝑜𝑛,𝐶𝐴)是由𝑉𝑜𝑛 𝑁𝑒𝑢𝑚𝑎𝑛𝑛提出的一种在时
间、空间、状态上都离散的动力系统,利用相邻元胞之间的互相作用关系,能够以极
简单的规则模拟复杂的行为,很适合用于生态养殖池的水质分析[10]。
一个完整的元胞自动机系统通常包括元胞维数(𝐷)、邻居(𝑁)、状态(𝑆)及演化
规则(𝑓),记为𝐴 = (𝐷, 𝑁, 𝑆, 𝑓)。其中,元胞是构成元胞自动机的最小单位,在本文中设
置为S = (I,II,III, IV, V)五种藻类密度状态,以总藻类密度作为衡量指标,具体划分如下,
𝑣表示该元胞的总藻类密度值。

6 模型优缺点


 模型优点:
本文第一问中采用的皮尔森相关性分析,可以很好地测度两个变量间的相关性关
系,具有坚实的数学理论基础。
在第二问中使用的投影寻踪模型选择将高维数据投影到一个低维空间,根据投影
值来分析高维数据的分类结构特征,避免了高维数带来的计算复杂性,求解使用的基
于实数编码的加速遗传算法在传统的遗传算法上进行了修改,减少了求解中计算量,
使得求解的速度更为快捷。
第三问中建立的支持向量回归机模型,作为机器学习领域一种相对较为成熟的数
据挖掘手段,具有坚实的理论基础,并且可以很好地表征数据间的深度联系。
而元胞自动机模型在数据的反映能力上形象直观,并且作为一个动态模型,它可
以十分清楚地模拟事物的变化情况。
 存在的问题:
本文的缺点在于,题中所提供的数据量较少,在支持向量回归机训练过程中,数
据量对模型的精度存在一定的限制,若存在更多的数据,训练所得结果会更加贴近实际。

7 模型推广


本次建模中所使用投影寻踪模型可很好地处理高维数据,在数据挖掘领域具有广
泛的实用性。基于实数编码的加速遗传算法具有很强的兼容性和扩展性,可以与其他
很多算法相结合进行数据的分析处理,可以模拟复杂的优化问题,在函数优化、组合
优化等领域中均已得到成功的应用。
而本文在预测时采用的支持向量机作为一个机器学习方法可以有效地解决分类、
回归等数据挖掘问题,在天气评价,军事,产业结构、效能评估等领域均具有重要的
借鉴意义。
处理第五问采用的元胞自动机模型,作为一种特殊的动力系统,可用作仿真任意
复杂的计算过程,可以直观地表现事物的变化情况,在社会学、生物学、地理学中也
具有广泛的应用。


8 参考文献


[1]马健荣,邓建明,秦伯强,龙胜兴. 湖泊蓝藻水华发生机理研究进展[J]. 生态学报,2013,10:3020-
3030.
[2]刘峰. 养殖水体水华发生的原因探讨[D].东北农业大学,2007.
[3]蔡继晗,沈奇宇,郑向勇,李凯,吕永林,陈强. 氨氮污染对水产养殖的危害及处理技术研究进展
[J]. 浙江海洋学院学报(自然科学版),2010,02:167-172+195.
[4] 赵小勇. 投影寻踪模型及其在水土资源中的应用[D].东北农业大学,2006.
[5] 金芬. 遗传算法在函数优化中的应用研究[D].苏州大学,2008.
[6] 金菊良,杨晓华,丁晶. 基于实数编码的加速遗传算法[J]. 四川大学学报(工程科学版),
2000,04:20-24.
[7] 曾绍华.支持向量机回归机算法理论研究与应用[D].重庆大学,2006.
[8]江成. 水体扰动对藻生长机制与 QCS 水库富营养化控制的影响研究[D].上海交通大学,2014.
[9]申玉春,熊邦喜,叶富良,阮芳. 虾-鱼-贝-藻生态优化养殖及其水质生物调控技术研究[J]. 生态
学杂志,2005,06:613-618.
[10] Wolfram S. Theory and applications of cellular automata[M]. Singapore: World Scientific, 1986
[11]施炜纲,刘凯,张敏莹,徐东坡. 春季禁渔期间长江下游鱼虾蟹类物种多样性变动(2001-2004
年)[J]. 湖泊科学,2005,02:169-175.

  • 12
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

2024年华数杯数学建模

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值