学习笔记:【案例】财政收入影响因素分析及预测模型

案例来源:《Python数据分析与挖掘实战》第13章

案例背景与挖掘目标

输入数据:
《某市统计年鉴》(1995-2014)

挖掘目标:

  1. 梳理影响地方财政收入的关键特征,分析、识别影响地方财政收入的关键特征的选择模型
  2. 结合目标1的因素分析,对某市2015年的财政总收入及各个类别收入进行预测

分析方法与过程(选择的原则)

以往对财政收入的分析会使用多元线性回归模型,和最小二乘估计方法来估计回归模型的系统,但这样的结果对数据依赖程度很大,并且求得的往往只是局部最优解,后续的检验可能会失去应有的意义。
因此本案例运用Adaptive-Lasso变量选择方法来研究。
子任务规划

  1. 从某市统计局网站以及各统计年鉴搜集到该市财政收入以及各类别收入
  2. 建立Adaptive-Lasso变量选择模型
  3. 代入构建好的人工神经网络模型中,从而得到2015年预测值

实验
掌握Adaptive-Lasso变量选择和神经网络预测模型

  1. 分析数据,识别关键特征,使用Adaptive-Lasso变量选择方法进行筛选
  2. 用GM(1,1)灰色预测方法得到筛选出的关键影响因素的2014、2015的预测值
  3. 代入神经网络模型,得到2014、2015预测值

代码存档:

实验

掌握Adaptive-Lasso变量选择和神经网络预测模型

  1. 分析数据,识别关键特征,使用Adaptive-Lasso变量选择方法进行筛选
  2. 用GM(1,1)灰色预测方法得到筛选出的关键影响因素的2014、2015的预测值
  3. 代入神经网络模型,得到2014、2015预测值
import numpy as np
import pandas as pd
import os
# 查看数据概况
dpath = './demo/data/data1.csv'
input_data = pd.read_csv(dpath)
r = [input_data.min(),input_data.max(),input_data.mean(),input_data.std()]
r = pd.DataFrame(r, index=['Min','Max','Mean','Std'])
r = np.round(r,2)
print(r)
              x1       x2       x3        x4        x5          x6       x7  \
Min   3831732.00   181.54   448.19   7571.00   6212.70  6370241.00   525.71   
Max   7599295.00  2110.78  6882.85  42049.14  33156.83  8323096.00  4454.55   
Mean  5579519.95   765.04  2370.83  19644.69  15870.95  7350513.60  1712.24   
Std   1262194.72   595.70  1919.17  10203.02   8199.77   621341.85  1184.71   

            x8      x9     x10     x11   x12       x13        y  
Min     985.31   60.62   65.66   97.50  1.03   5321.00    64.87  
Max   15420.14  228.46  852.56  120.00  1.91  41972.00  2088.14  
Mean   5705.80  129.49  340.22  103.31  1.42  17273.80   618.08  
Std    4478.40   50.51  251.58    5.51  0.25  11109.19   609.25  
# 求解Pearson相关系数
np.round(input_data.corr(method='pearson'),2)
x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12
  • 0
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值