里用gam使用_【大数据部落】R语言GAM(广义相加模型)对物业耗电量进行预测...

原文链接:

http://tecdat.cn/?p=2856​tecdat.cn

848d3e44f12d12fee546f0af20d58658.png

人们对于电力的需求与依赖随着生活水平的提高而不断加深,用电负荷预测工作开始变得越来越重要,如果可以发现用电负荷的规律性,我们就可以合理安排用电负荷。我们使用某商业物业两个星期的电耗数据进行分析。

GAM模型

当因变量和自变量不呈线性关系时,可用广义相加模型(GAM)。GAM模型的优点,在于其解决响应变量与预测因子间的高度非线性和非单调关系方面的突出能力,是一种基于数据的模型(data-driven),数据决定着响应变量和预测因子之间的关系。电耗数据不是线性的,同时是一个有季节趋势的时间序列趋势。那么GAM模型是否可以用来预测时间序列呢?

首先绘制出用电量的时间序列图,看下趋势

ggplot(data_r, aes(date_time, value)) + geom_line() + theme(panel.border = element_blank(), panel.background = element_blank(), panel.grid.minor = element_line(colour = "grey90"), panel.grid.major = element_line(colour = "grey90"), panel.grid.major.x = element_line(colour = "grey90"), axis.text = element_text(size = 10), axis.title = element_text(size = 12, face = "bold")) + labs(x = "日期", y = "用电量 (kW)")

c3c7cac3ff5b4a4cd4c559f786a258c5.png

gam_1 <- gam(Load ~ s(Daily, bs = "cr", k = period) + s(Weekly, bs = "ps", k = 7), data = matrix_gam, family = gaussian)

绘制时间序列有两个主要自变量:天和周。我们的响应变量是电力负荷。我们来构建出GAM模型

fab64ef086c847a471c206ab1ebfcf4a.png

我们可以看到时间变量对电力负荷的影响。在左图中,负荷的峰值是白天下午3点左右。同时我们可以看到,周末耗电量下降。

affe2bb4e24ea4c3d09fc20ab520ac14.png

然后我们绘制耗电量曲面图更直观的发现规律。

e685966ddb0175b5c0077019b4df040f.png

我们可以看到,最高峰是当“每日”变量的值接近(3点),“周”变量的值为1(这是星期一)。

52d4c466b5dc83d325005a0afa1f8e68.png

最后,我们可以看到,电力负荷的最高值是星期一下午3点直到星期四,然后负载在周末减少。

结语

GAM模型的优点在于其解决高度非线性预测问题的突出能力。GAM模型是否可以应用在其他领域?

抛砖:logistic regression在credit risk里面用的很多,个人认为作为统计进入金融风控是个不错的切入点。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值