第十届泰迪杯数据挖掘B题:电力系统负荷预测分析--解题思路与部分代码03


笔者背景

第九届泰迪杯上市公司财务造假全国一等奖,曾入围特等选拔7进3,并进行答辩。由于实习的原因不参加本次比赛,在此记录一下自己的一些想法与思考,希望可以为大家提供一些思路。此外,就多次参加比赛的经历中,笔者认为在模型构建以及论文撰写中,大家可以把某一个点作为论文的亮点,围绕这个点来展开,并对比这一个处理方法相较于其他的方法有多大的提升。通过图表的方式将多个模型结果进行可视化对比,提高摘要的质量,做到这几点,一般离拿奖就不远了。

赛题描述

B题:电力系统负荷预测分析

一、问题背景

电力系统负荷(电力需求量,即有功功率)预测是指充分考虑历史的系统负荷、经济状况、气象条件和社会事件等因素的影响,对未来一段时间的系统负荷做出预测。负荷预测是电力系统规划与调度的一项重要内容。短期(两周以内)预测是电网内部机组启停、调度和运营计划制定的基础;中期(未来数月)预测可为保障企业生产和社会生活用电,合理安排电网的运营与检修决策提供支持;长期(未来数年)预测可为电网改造、扩建等计划的制定提供参考,以提高电力系统的经济效益和社会效益。

复杂多变的气象条件和社会事件等不确定因素都会对电力系统负荷造成一定的影响,使得传统负荷预测模型的应用存在一定的局限性。同时,随着电力系统负荷结构的多元化,也使得模型应用的效果有所降低,因此电力系统负荷预测问题亟待进一步研究。

二、解决问题

1.地区负荷的中短期预测分析

根据附件中提供的某地区电网间隔15分钟的负荷数据,建立中短期负荷预测模型:

(1)给出该地区电网未来10天间隔15分钟的负荷预测结果,并分析其预测精度;

(2)给出该地区电网未来3个月日负荷的最大值和最小值预测结果,以及相应达到负荷最大值和最小值的时间,并分析其预测精度。

2.行业负荷的中期预测分析

对不同行业的用电负荷进行中期预测分析,能够为电网运营与调度决策提供重要依据。特别是在新冠疫情、国家“双碳”目标等背景下,通过对大工业、非普工业、普通工业和商业等行业的用电负荷进行预测,有助于掌握各行业的生产和经营状况、复工复产和后续发展走势,进而指导和辅助行业的发展决策。请根据附件中提供的各行业每天用电负荷相关数据,建立数学模型研究下面问题:

(1)挖掘分析各行业用电负荷突变的时间、量级和可能的原因。

(2)给出该地区各行业未来3个月日负荷最大值和最小值的预测结果,并对其预测精度做出分析。

(3)根据各行业的实际情况,研究国家“双碳”目标对各行业未来用电负荷可能产生的影响,并对相关行业提出有针对性的建议。


第一问: 给出该地区电网未来10天间隔15分钟的负荷预测结果,并分析其预测精度

对于时间序列预测模型,一般采用arima,Facebook研发的prophet预测模型,还有对数据进行特征处理后采用lightGBM等机器学习模型进行预测。在回归中,预测精度一般采用RMSE,MAPE等评价指标进行预测精度判断。此外,对于后续数据增加,比较有亮点的地方是通过不同的调参方法进行参数调优。个人认为在本次比赛中,调参方法若是选择的好,参加比赛的小伙伴可以着重于这个点来撰写论文,获奖的可能性极大。

在01的基础上,大家可以参考数据预处理后的格式,并结合lightGBM构建其他的机器学习模型。在此基础上,增加较为前沿的调参方法。可以通过对比传统调参方法,网格搜索(GridSearchCV)和optuna,Hyperbot,openbox三者之间的运行速度,拟合优度等反向选择最好的调参方法进行预测。基于lightGBM,以GridSearchCV和Hyperbot为例:

1.网格搜索

from sklearn.model_selection import GridSearchCV

lgbm = lgb.LGBMRegressor()
parameters = {
   
    'n_estimators': [10, 50, 100, 500, 1000], #树数
            'learning_rate': [0.0001, 0.001, 0.01, 0.1, 1.0], #学习率
            'max_depth': range(1, 5), #树深
            'boosting_type': ['gbdt', 'dart', 'goss'] #增压型
}
cv = RepeatedKFold(n_splits = 10, n_repeats = 3, random_state = 1)
clf = GridSearchCV(lgbm, parameters, cv=cv)
clf.fit(train_x, train_y)
sorted(clf.cv_results_.keys())
clf.best_estimator_           

params = {
   
    'n_estimators': 1000,
    'max_depth': 1,
    'num_leaves': 2**4
第十届泰迪杯数据挖掘竞赛B要求参赛者根据一组电商平台的销售数据分析用户行为和购买特征,并构建一个预测模型来预测用户的购买行为。 首先,我们可以对电商平台的销售数据进行探索性数据分析。通过分析用户行为特征,比如用户点击量、收藏量、加购物车量、购买量等指标,可以得到用户的行为习惯和购买偏好。同时,还可以探索用户属性特征,如用户年龄、性别、地域等,进一步了解不同用户群体的购买特征。 接下来,可以使用机器学习算法构建预测模型。可以尝试使用决策树、随机森林、逻辑回归等算法来建模,根据之前分析的用户行为和属性特征作为输入,购买行为作为输出,训练模型。可以使用交叉验证方法选择最优的模型,并进行模型评估和调整。 此外,还可以尝试使用聚类分析方法,将用户划分为不同的群体,进一步了解不同用户群体的购买倾向和特征。有助于制定针对不同用户群体的推广和营销策略,提高用户购买转化率和销售额。 最后,根据模型预测结果,可以制定相应的推荐策略。利用模型预测用户的购买行为,可以向用户推荐相关的商品或服务,提高用户的购买满意度和复购率。 总而言之,第十届泰迪杯数据挖掘竞赛B要求参赛者通过分析销售数据,挖掘用户行为和购买特征,并构建预测模型和推荐策略,以提升电商平台的销售业绩。
评论 17
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值