数模学习日记(1)

 1. ARIMA时间序列模型

现在回顾一下它的基本建模流程:首先是画原始数据集的序列时序图;然后就是进行差分平稳(可能在未来需要改差分步数);然后绘制自相关函数图和偏自相关函数图,根据所得的图选择ARIMA(p,d,q)的参数;拟合ARIMA模型,可以根据AIF和BIF选择最优的,再绘制残差图检验我们这个模型合不合适;白噪声检验;最后预测,并且可以可视化预测结果。

2.机器学习

细化来说,(1)学会了Q型聚类分析和R型聚类分析,主要要会看聚类后的树状图(注意聚类分析前要标准化数据),它俩的区别是R型聚类分析更针对变量很多的情况,可以先分析它们之间的相关性,相关性大的几个就选一个代表,减少聚类分析的压力。

(2)结合@艾派森的大数据分析案例入门了一下决策树预测和随机森林预测。第一个案例的实践过程中,有对文字型变量创建字典储存;删除不必要的列;拆分数据集为训练集和测试集;定义一个预测函数,里面用到构建的决策树模型。第二个案例的实践过程中,最大的收货是学会了用图像进行探索性数据分析,fig画出来的图真的很好看,可以从不同纬度进行分析。

3.以 2020Mathorcup D题 的问题一进行了实践

重点训练了数据预处理,(1)筛选数据  (2)删除数据缺失值  (3)按键合并数据表

然后复习了相关性分析,皮尔逊相关系数和斯皮尔曼相关系数试用范围,可以用热力图展现。

知道了随机森林的另一种用法,就是在探索多个指标对目标值的影响时,可以通过随机森林求出每个指标的重要性权重

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值