基于XGBoost的中国GDP分析与预测(下)

目录

第1章 绪  论

1.1 研究背景

1.2 研究意义

1.3 课程设计的主要内容

第2章 国内生产总值数据预处理

2.1 数据集概述

2.1.1数据来源
2.1.2 数据指标含义

2.2 数据清洗

2.2.1缺失数据处理
2.2.2清除冗余数据

2.3 数据变换

2.3.1数据规范化处理

第3章 国内生产总值年度数据分析

3.1 探索性数据分析

3.1.1数据描述性统计及可视化
3.1.2指标的相关性分析及可视化

3.2数据集切分

3.2.1建立特征数据与标签数据
3.2.2切分数据集

第4章 XGBoost预测国内生产总值

4.1 建模分析

4.2 XGBoost模型

4.2.1 建立XGBoost模型

4.2.2 网格搜索优化参数

4.2.3 模型评优

4.3 模型的价值分析

5、结论与展望

5.1结论
5.2展望

6、参考文献 

4章 XGBoost预测国内生产总值

4.1 建模分析

4.1.1分析选择模型

时间序列数据即按照时间顺序收集到具有相同指标的一系列数据,在经济、金融、环境、工程、医学等多领域中,存在大量时间序列形式的数据。虽然一直以来,学者们都重点关注对时间序列数据内在规律的挖掘以及预测方法的研究,但直至如今时间序列分析与预测也是最具有难度的数据挖掘问题之一,对于时间序列分析方法的思考一直在继续。

决策树作为一种数据挖掘技术已发展的较为成熟,并由此衍生出众多具备优良性能的算法。其中XGBoost2016年基于提升决策树提出的改进算法,在多领域分析预测均取得了显著成果。在医学领域,张洪侠[3]等人首先利用XGBoost模型中的特征重要性排序探究了对模型贡献较大的变量,然后基于这些影响变量建立了2型糖尿病的发病风险预测模型,得到了准确度较高的预测结果。柴静[4]等人采用XGBoost模型预测了矿山压力,通过与BP神经网络、SVM模型的预测结果进行比较,发现XGBoost模型的预测速度和精度均高于其他模型。王重仁[5]等人首先采用社交网络分析方法提取出相关特征变量,然后将其引入模型中建立了XGBoost模型对互联网的客户流失问题进行预测分析。通过与逻辑回归、支持向量机和随机森林等模型的预测结果对比,发现XGBoost模型更为有效。

XGBoost不仅

  • 28
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值