【2024年美国大学生数学建模竞赛】F题完整解析(参考论文)

本文探讨了非法野生动物贸易的全球挑战,通过数据收集、分析和建模,确定了美国作为主要研究对象。文章构建了权力、资源和兴趣的指标体系,利用多元线性回归预测模型来评估项目影响,并预测实施后的效果。
摘要由CSDN通过智能技术生成

写在前面

发布赛题一直到现在,总算完成了F题完整的解题过程,包括代码完整代码与结果、解题思路、模型文档与论文框架~

学姐的代码和论文框架保证原创,保证高质量哦,都是跟国奖学长一起努力完成的!!

摘要

近年来,非法野生动物贸易每年涉及的金额高达265亿美元,被认为是全球第四大非法贸易。本文基于收集的数据,对非法野生动物贸易进行研究。

问题一,为了确定五年项目的研究对象我们利用非法野生动物为关键词对各国政府进行搜索。为了更加突出其结果,我们绘制了词云图对出现频数进行可视化表达。通过结果可以看出美国的搜索尤为明显,因此本文选择美国为主客户。为了深入研究美国与相关指标,我们利用知网、PubMed、Google Scholar等期刊检索网站以非法野生动物进行检索,再以美国为关键词进行二次检索。最终得出美国出现频率最高的16个指标作为该问题的指标评价体系。并使用语言大模型(Chat GPT4.0)对收集的指标进行分类得出权力、资源和兴趣三类一级指标的划分。

为了找到相关的数据,利用python数据爬虫以及自行寻找等方式,在国家统计局、工信部、能源局、世界银行等开放数据库获取数据。对于数据预处理,利用收集到的数据集利用q-q图以及k-s检验判定分布方式,得出数据存在部分服从正态分布、部分不服从。因此,对于服从正态分布的数据使用3σ原则判定异常值,对于不服从的数据使用箱线图判定异常值。将异常值替换为缺失值,对于缺失值,这里采用牛顿线性插值的方式。由于指标数量过多,这里使用KMO检验和Bartlett球形检验判定指标独立性,对于通过检验的使用主成分分析法进行降维,对于未通过检验的指标使用相关性分析进行降维。利用降维后的数据进行相关性分析,判断指标与选择的四个因变量的关系,利用数据预处理之后的数据,建立多元线性回归模型进行预测。

对于问题二,利用联合国发布的World Wildlife Crime Report中指出的相关数据,等一些文献支撑我们可以看出选择美国作为研究的主题。利用问题一选取的三个一级指标与四个因变量构建偏最小二乘法回归分析,分析每一个因变量与三个指标的关系。在有五年干预的情况下我们直接使用线性回归模型对三个自变量进行预测。以没有干预的预测值与实际的五年项目进行对比,以来来说明客户。

问题三,基于问题一的指标体系构建方式,我们发现会造成部分关键指标的丢失。因此,我们对未选择的其他指标进行分析,根据美国统计年鉴对三个一级指标的描述,进一步得出新的指标来表示对国内经济其他部门的债权作为新的额外的权力以及能源使用量作为资源。

问题四,对实施项目后进行预测。首先,利用常规数据直接进行预测,得到没有实时项目下未来10年的情况。再利用五年项目的规定,对未来五年每年的数据进行插值,得到新的数据集,利用该数据集对未来十年进行预测。最后比对两种情况在的差异性。在进行灵敏度分析完成对问题五的求解。

综上所示,本文基于收集的数据对非法野生动物贸易建立了预测模型进行预测研究,以此实现对五年项目的描述,并写出一份报告呈现给美国政府。

关键词:非法野生动物贸易、数据驱动、全球合作、环境保护、UNEP

一 问题重述

1.1 问题背景:

非法野生动物贸易是一个全球性问题,它不仅威胁到生物多样性,还对环境、社会和经济产生了深远的负面影响。根据国际自然保护联盟(IUCN)和世界自然基金会(WWF)等组织的报告,非法野生动物贸易包括无许可捕猎、运输和销售野生动植物及其产品,其范围广泛,涵盖了从大象象牙、犀牛角、虎皮到稀有植物和木材的贸易。

当前现状

非法野生动物贸易是一项年收入高达数十亿美元的全球性非法活动,仅次于毒品、人口和武器贸易,被认为是世界上最大的黑市之一。这种贸易严重威胁着全球数千种野生动植物的生存,导致许多物种濒临灭绝。

影响范围

  1. 生物多样性的丧失:非法野生动物贸易直接导致某些物种数量急剧下降,甚至灭绝。这种损失不仅是生物学上的,也破坏了生态系统的平衡和稳定性,影响了自然界的健康和功能。
  2. 环境破坏:为了捕捉野生动物,森林被砍伐,栖息地被破坏,这进一步加剧了生物多样性的丧失。
  3. 社会和经济影响:非法贸易破坏了法治,腐蚀了社会结构,削弱了政府的管理能力。它还威胁到依赖于可持续利用野生动植物资源的社区的生计。
  4. 公共卫生风险:非法野生动物贸易增加了人类与野生动物之间疾病传播的风险,如埃博拉和SARS等疾病的爆发就与野生动物贸易有关。

应对措施

全球范围内,各国政府和国际组织已经采取了一系列措施来打击非法野生动物贸易。例如,CITES(濒危野生动植物种国际贸易公约)规定了国际间野生动植物贸易的法律框架,旨在确保国际贸易不会威胁野生动植物种的生存。
此外,许多非政府组织(NGO)也在努力提高公众对非法野生动物贸易问题的认识,推动政策变革,并在实地工作中保护野生动植物。技术创新,如使用人工智能(AI)和大数据分析,也被用来监控非法贸易活动,追踪野生动物的非法流通路径。

挑战

尽管采取了多项措施,但非法野生动物贸易仍然是一个严峻的问题。挑战包括法律执行不足、缺乏国际合作、贸易网络的复杂性以及需求侧的持
续压力。为了有效地打击非法野生动物贸易,需要全球性的合作,包括加强法律和政策的实施、提高公众意识、促进科技在野生动物保护中的应用,以及增强跨国界执法行动的合作。
结论
非法野生动物贸易是一个复杂的全球性问题,它要求国际社会、政府、非政府组织、科研机构以及公众共同努力,采取综合性的策略来解决。通过加强国际合作、利用现代科技和提高公众参与度,可以在全球范围内更有效地打击这一犯罪活动,保护地球上宝贵的野生动植物资源。

1.2 问题回顾

1、确定目标客户群体:
明确哪些组织或个人有能力、资源和意愿执行此项目。
阐述这些客户可以实施的具体行动。

2、项目适应性分析:
阐述为何此项目适合所选客户。
引用已发表的研究和您自己的分析来支持项目的选择。
说明如何通过数据驱动的分析来说服客户承担此项目。

3、资源需求评估:
列出客户执行项目所需的额外权力和资源。
结合实际情况提出合理的假设。

4、项目影响预测:
描述项目实施后对非法野生动物贸易的可量化影响。
阐述您是如何进行分析来确定这些影响的。

5、项目可行性及风险分析:
评估项目实现预期目标的可能性。
识别可能极大促进或损害项目效果的情境或事件。

二 问题分析

2.1 数据分析

为了找到相关的数据,利用python数据爬虫以及自行寻找等方式,在国家统计局、工信部、能源局、世界银行等开放数据库获取数据。对于数据预处理,利用收集到的数据集利用q-q图以及k-s检验判定分布方式,得出数据存在部分服从正态分布、部分不服从。因此,对于服从正态分布的数据使用3σ原则判定异常值,对于不服从的数据使用箱线图判定异常值。将异常值替换为缺失值,对于缺失值,这里采用牛顿线性插值的方式。由于指标数量过多,这里使用KMO检验和Bartlett球形检验判定指标独立性,对于通过检验的使用主成分分析法进行降维,对于未通过检验的指标使用相关性分析进行降维。利用降维后的数据进行相关性分析,判断指标与选择的四个因变量的关系,利用数据预处理之后的数据,建立多元线性回归模型进行预测。

2.2 问题一分析

问题一,为了确定五年项目的研究对象我们利用非法野生动物为关键词对各国政府进行搜索。为了更加突出其结果,我们绘制了词云图对出现频数进行可视化表达。通过结果可以看出美国的搜索尤为明显,因此本文选择美国为主客户。为了深入研究美国与相关指标,我们利用知网、PubMed、Google Scholar等期刊检索网站以非法野生动物进行检索,再以美国为关键词进行二次检索。最终得出美国出现频率最高的16个指标作为该问题的指标评价体系。并使用语言大模型(Chat GPT4.0)对收集的指标进行分类得出权力、资源和兴趣三类一级指标的划分。利用数据预处理之后的数据,建立多元线性回归模型进行预测。

2.3 问题二分析

对于问题二,利用联合国发布的World Wildlife Crime Report中指出的相关数据,等一些文献支撑我们可以看出选择美国作为研究的主题。利用问题一选取的三个一级指标与四个因变量构建偏最小二乘法回归分析,分析每一个因变量与三个指标的关系。在有五年干预的情况下我们直接使用线性回归模型对三个自变量进行预测。以没有干预的预测值与实际的五年项目进行对比,以来来说明客户。

2.4 问题三分析

问题三,基于问题一的指标体系构建方式,我们发现会造成部分关键指标的丢失。因此,我们对未选择的其他指标进行分析,根据美国统计年鉴对三个一级指标的描述,进一步得出新的指标来表示对国内经济其他部门的债权作为新的额外的权力以及能源使用量作为资源。

2.5 问题四、五分析

问题四,对实施项目后进行预测。首先,利用常规数据直接进行预测,得到没有实时项目下未来10年的情况。再利用五年项目的规定,对未来五年每年的数据进行插值,得到新的数据集,利用该数据集对未来十年进行预测。最后比对两种情况在的差异性。在进行灵敏度分析完成对问题五的求解。
最终,本文基于收集的数据对非法野生动物贸易建立了预测模型进行预测研究,以此实现对五年项目的描述,并写出一份报告呈现给美国政府。

三 模型假设

为了方便模型的建立与模型的可行性,我们这里首先对模型提出一些假设,使得模型更加完备,预测的结果更加合理。
1、假设给出的数据均为真实数据,真实有效。
2、假设对于一些较为异常的数据的出现具有一定的合理性。
3、假设我们对数据中缺失值的处理方式不会对预测结果造成太大的误差。
4、假设给出的脱敏数据没有造成数据的损坏。

四 符号说明

为了方便我们模型的建立与求解过程 ,我们这里对使用到的关键符号进行以下说明:
在这里插入图片描述
(注:这里只列出论文各部分通用符号,个别模型单独使用的符号在首次引用时会进行说明。)

五 问题一模型建立与求解

5.1 数据收集

为了确定五年项目的研究对象我们利用非法野生动物为关键词对各国政府进行搜索。为了更加突出其结果,我们绘制了词云图对出现频数进行可视化表达。

通过结果可以看出美国的搜索尤为明显,因此本文选择美国为主客户。为了深入研究美国与相关指标,我们利用知网、PubMed、Google Scholar等期刊检索网站以非法野生动物进行检索,再以美国为关键词进行二次检索。最终得出美国出现频率最高的16个指标作为该问题的指标评价体系。

使用语言大模型(Chat GPT4.0)对收集的指标进行分类得出权力、资源和兴趣三类一级指标的划分。最终得到指标评价体系如下所示
在这里插入图片描述
对于该分类,将这些指标划分为“权力”、“资源”和“兴趣”三类时,我们需要对每个指标的含义和它们所代表的领域有一个清晰的理解。下面是根据每个指标的特性进行的分类尝试:

权力

“权力”类别可以包括那些反映一个国家或社会在政治、法律和经济结构上的实力和影响力的指标。这些指标通常与政府决策、法律框架和经济稳定性有关。

  • 法律权利力度指数(0=弱,12=强)
  • 关税表中达到国际最高关税税率的所有税目产品所占比例(%)
  • 约束税率,简单均值,所有产品(百分比)
  • 税收(占国民生产总值(GDP)比例)
  • 关税及其他进口税(现价本币单位)
  • 其他税收(现价本币单位)
    这些指标反映了一个国家在税收、法律和关税政策上的决策权,这些都是国家权力的体现。

资源

“资源”类别包括那些反映一个国家在人力、物质和能源资源上的丰富程度和可用性的指标。这些资源是经济发展的基础。

  • 矿石和金属进口(商品进口的百分比)
  • 能源净进口(占能源使用量的百分比)
  • 护士和助产士(每千人)
  • 人力资本指数 (数值范围 0-1)
  • 教育公共开支总额,总数(占GDP的比例)
  • 国内总储蓄(现价本币)
    这些指标涉及到一个国家的自然资源、人力资源、教育投资和储蓄水平,这些都是国家发展的资源基础。

兴趣

“兴趣”类别可能包括那些反映一个国家在社会、科技和文化领域的发展水平和兴趣点的指标。这些指标通常与一个国家的创新能力、生活方式和国际贸易有关。

  • 人口增长(年度百分比)
  • 公共征信系统覆盖(成年人所占百分比)
  • 高科技出口(占制成品出口的百分比)
  • 高科技出口(现价美元)
  • 计算机、通信和其他服务(占商业服务进口额的百分比)
  • 基尼 (GINI) 系数
  • 库存变化(不变价本币单位)
    这些指标涵盖了一个国家在科技创新、社会福利、国际贸易和收入不平等方面的表现,这些都是社会兴趣和发展方向的体现。

完整论文与代码获取

以下是完整论文、技术文档。有需要的小伙伴看下面哦
在这里插入图片描述
在这里插入图片描述

  • 17
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值