自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (3)
  • 收藏
  • 关注

原创 基于LSTM-Attention模型的光伏电站发电量预估(1)

目前我国正在推动发展太阳能光伏发电,该项目预测技术的研究仍处于广泛研究阶段。准确的光伏发电量预测对于保障高比例光伏接入后系统的安全稳定与经济运行具有重要意义。基于此,本文将对光伏电站发电量预测进展开实验,结合已有的研究报告,推出LSTM-Attention模型,并基于2018年DataFountain比赛数据进行研究。本文首先会指出研究问题的难点,其次介绍数据集及预处理过程,紧接着在阐述核心模型原理后对模型进行检验评估,最后会对实验进行总结并提出改进建议。...

2022-06-25 12:57:28 3552 6

原创 基于多种模型集成学习的旅行目的地预测(1)

摘要随着后疫情时代的到来,出行游玩的需求不断增大。而在共享经济、全域旅行、旅游+的浪潮不断涌现,跨界合作的增多,市场大环境下的住宿业正面临着新的机遇和挑战。在新的时代背景和高新科技的助力下,以民宿、短租为主的非标住宿异常突起。Airbnb 作为非标住宿首秀,以互联网为依托,在不断扩大用户市场的同时,通过数据分析准确定位用户预订目标,以此掌握粘性客源。 旅行目的地预测可以帮助民宿平台系统在用户注册后未预订前为用户推荐对应目的地国家的民宿或短租服务,提高住宿业的流量吸纳能力,同时...

2022-03-16 09:41:23 602

基于LSTM-Attention模型的光伏电站发电量预估

预测精度和数据处理是目前光伏发电预估的难点。一方面光伏发电受太阳能影响,具有波动、间歇和较强的随机性,而一般的学习模型的学习能力不足,无法从历史数据中学习到光伏发电量和气象数据间的关系;另一方面,光伏发电功率预测技术多围绕气象条件和历史数据建模,这类数据存在数据不全面、时间滞后性等问题,会存在一定的误差。此外数据处理也是问题的棘手之处。在数据预处理环节,如何确保输入数据的有效性和可信度,如何筛选出重要的特征指标,如何量化分析每种主要因素对预测结果的影响,每一步都非常关键。 本次数据集分为训练集和测试集,由于测试集中没有发电量指标数据,因此本次处理只选择训练数据集,共有样本光伏发电设备采集信息9000条。其中包含21列变量信息,包括光伏板运行状态参数和气象参数。

2023-03-23

预测模型预测及评估-基于多种模型集成学习的旅行目的地.ipynb

方法描述部分主要侧重描述本文运用的预测模型,以及其中的框架,同时指出用于评价模型的指标。首先我们根据特征自动化选择的结果,决定选择'gender', "first_affiliate_tracked","first_browser","time_gap","bins","Search_Booking_Gap_2","signup_method_flow","affiliate_channel_provider"作为我们的特征变量。 涉及到:KNN、SVM、DT、Stacking、AdaBoost、GBDT、Random Forest、XGBoost、RNN,同时在评估指标方面指出混淆矩阵、二级指标、三级指标和kappa系数。

2022-03-16

特征工程部分-基于多种模型集成学习的旅行目的地预测.ipynb

该部分涉及特征变量编码、特征相关性分析、训练集测试集拆分、PCA主成分分析、自动化特征选择及K-means聚类分析。

2022-03-16

数据预处理部分-基于多种模型集成学习的旅行目的地预测.ipynb

此部分主要对公开的数据进行汇总处理,用图表的形式客观的展现出相关特征变量。并通过适当的修改和填补,完善数据集。 论文的数据来自Kaggle网站的公开比赛,数据可以从以下公开网址获取:https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data。此次需要通过数据预测新用户在Airbnb民宿上首次预定的目的地是哪个国家。在下载得到的数据中,一共包含6个子数据集,分别是age_gender_bkts.csv, countries.csv, sample_submission_NDF.csv, session.csv, test_users.csv, train_users_2.csv. 由于在test_users.csv数据中没有目标变量,因此在运用测试集中会从train_users_2.csv中进行训练集和测试集的划分。

2022-03-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除