✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥 内容介绍
共享单车作为现代城市交通的重要组成部分,其租赁量的准确预测对于优化资源配置、提升运营效率以及缓解城市交通拥堵具有至关重要的意义。传统的预测模型,如ARIMA、LSTM、GRU等,在处理复杂的时序数据时往往面临信息遗忘或捕捉长期依赖不足的问题。近年来,以Transformer为代表的注意力机制模型在处理长序列数据方面展现出强大的能力,但其计算复杂度较高。而新近提出的Kolmogorov-Arnold Networks (KANs) 以其理论上的通用逼近能力和潜在的生物可解释性受到关注。本文旨在探索将KAN网络与各种门控循环单元(GRU、LSTM、BiLSTM)、时间卷积网络(TCN)以及Transformer结构相结合,构建一系列新型混合预测模型,并将其应用于共享单车租赁量的预测。通过对基线模型(如单独的LSTM、GRU、Transformer)以及本文提出的融合模型的性能进行对比分析,旨在评估不同融合策略对预测精度的影响,并探索如何通过简单的代码修改实现不同结构的切换,从而为共享单车租赁预测提供更灵活、高效且具有潜在可解释性的解决方案。
关键词:共享单车租赁预测;LSTM-KAN;BiLSTM-KAN;GRU-KAN;TCN-KAN;Transformer-KAN;时序预测;深度学习;KAN网络
引言
共享单车的普及显著改变了城市居民的出行方式,但在为用户带来便利的同时,如何有效地管理和调度共享单车资源成为运营者面临的挑战。精确预测不同时间段、不同区域的单车租赁需求,是实现智能化调度的前提。例如,准确预测高峰时段的租赁需求可以指导运营者提前投放单车,避免用户无车可用的情况;预测低谷时段的需求则有助于回收单车,降低维护成本。因此,共享单车租赁预测的研究具有重要的理论意义和实际应用价值。
传统的统计学方法,如自回归积分滑动平均模型(ARIMA),虽然能够捕捉线性依赖关系,但对于复杂的非线性时序数据预测效果有限。随着深度学习技术的发展,循环神经网络(RNN)及其变种,如长短期记忆网络(LSTM)和门控循环单元(GRU),因其能够处理序列数据并捕捉时间依赖性而广泛应用于时序预测。LSTM通过门控机制有效缓解了RNN的梯度消失问题,而GRU则在保持相似性能的同时简化了结构。双向LSTM(BiLSTM)通过同时考虑过去和未来的信息,进一步增强了模型的序列建模能力。
然而,LSTM和GRU在处理长序列时仍然可能存在对早期信息的遗忘。时间卷积网络(TCN)利用膨胀卷积(Dilated Convolution)技术,通过增加感受野来捕捉更长的时间依赖,并在某些时序预测任务中取得了优于RNN的性能。近年来,基于注意力机制的Transformer模型在自然语言处理领域取得了巨大成功,并逐渐被引入到时序预测领域。Transformer的核心在于自注意力机制(Self-Attention),它可以计算序列中任意两个位置之间的相关性,从而捕捉长距离依赖。然而,Transformer模型的计算复杂度随着序列长度的增加呈平方级增长,这在处理非常长的时序数据时会带来挑战。
与此同时,一种新型的神经网络架构——Kolmogorov-Arnold Networks (KANs) 被提出。KANs基于Kolmogorov-Arnold表示定理,理论上能够以更少的参数逼近任意连续函数。其核心思想是将传统的神经元中的固定激活函数替换为可学习的激活函数(通常是样条函数)。这种结构不仅具有强大的非线性逼近能力,而且其可学习的激活函数使得网络具有更好的可解释性,可以通过观察激活函数的形状来理解模型如何处理输入特征。
鉴于现有模型的优缺点以及KAN网络的潜力,本文提出将KAN网络与各种先进的时序建模结构(LSTM、BiLSTM、GRU、TCN、Transformer)相结合,构建一系列新型的混合预测模型,旨在结合各自的优势,提升共享单车租赁预测的精度。具体而言,本文将探索以下融合策略:
- 基于门控循环单元与KAN的融合(LSTM-KAN, BiLSTM-KAN, GRU-KAN)
:在LSTM、BiLSTM、GRU的门控机制或内部计算单元中引入KAN层,以增强模型对复杂非线性关系的建模能力。
- 基于时间卷积网络与KAN的融合(TCN-KAN)
:在TCN的卷积层之后或作为残差连接的一部分引入KAN层,以结合TCN捕捉局部和长期依赖的能力与KAN的强大非线性拟合能力。
- 基于Transformer与KAN的融合(Transformer-KAN)
:在Transformer的自注意力层或前馈神经网络层中引入KAN层,以增强Transformer对复杂非线性关系的建模能力,并可能提升模型的解释性。
本文将以一个经典的共享单车租赁数据集为例,通过实验验证这些融合模型的有效性,并与基线模型进行对比。更重要的是,本文将展示如何通过修改一行核心代码,在不同的融合模型结构之间进行快速切换,从而方便研究人员和工程师根据具体需求选择和调整模型。
二、 相关工作
共享单车租赁预测是时序预测领域的一个重要研究分支。已有的研究工作可以大致分为以下几类:
- 统计学方法
:ARIMA模型是经典的统计学时序预测方法,适用于处理具有趋势和季节性的线性数据。然而,共享单车租赁数据通常受到多种非线性因素的影响,如天气、节假日、特殊事件等,使得ARIMA模型的预测精度有限。一些改进的统计模型,如季节性ARIMA (SARIMA) 也被应用于此领域。
- 机器学习方法
:支持向量机(SVM)、随机森林(Random Forest)、梯度提升树(Gradient Boosting Tree)等机器学习模型也被用于共享单车租赁预测。这些模型能够处理非线性关系,但对于捕捉长期时间依赖性存在不足。
- 深度学习方法
:
- RNN及其变种
:LSTM和GRU是时序预测中最常用的深度学习模型,已被广泛应用于共享单车租赁预测。许多研究结合外部因素(如天气、日期等)改进了LSTM和GRU模型的性能。BiLSTM也通过双向处理序列信息提升了预测精度。
- CNN及其变种
:卷积神经网络(CNN)虽然最初用于图像处理,但通过一维卷积或巧妙的网络结构设计,也被应用于时序预测,例如TCN。TCN在多个时序预测任务中展现了优越性。
- 注意力机制与Transformer
:基于注意力机制的模型,特别是Transformer,在处理长序列数据方面展现出强大的能力。近年来,Transformer模型及其变种也开始被应用于共享单车租赁预测,通过自注意力机制捕捉不同时间点之间的复杂关系。
- 图神经网络(GNN)
:考虑到共享单车租赁数据具有空间属性(不同区域的租赁量相互关联),一些研究将图神经网络与时序模型结合,构建时空预测模型。
- RNN及其变种
- 混合模型
:为了结合不同模型的优势,许多研究提出了混合模型,例如将统计模型与深度学习模型结合,或者将不同的深度学习结构进行融合。例如,LSTM-CNN混合模型已被用于捕捉时序数据的局部和全局特征。
本文提出的方法属于混合模型范畴,但其独特性在于将新型的KAN网络与多种主流的时序建模结构(LSTM、BiLSTM、GRU、TCN、Transformer)进行系统性的融合,并探讨这种融合策略的有效性及其实现上的灵活性。与以往将固定激活函数(如ReLU、Sigmoid)应用于混合模型不同,KAN网络的可学习激活函数有望为预测模型带来更强的非线性逼近能力和潜在的可解释性。
三、 方法论
本节将详细介绍本文提出的各种基于KAN的融合模型结构,并阐述如何通过简单的代码修改实现不同模型之间的切换。
3.1 KAN网络基础回顾
Kolmogorov-Arnold Networks (KANs) 的核心思想是将传统的神经元中的加权求和后接固定激活函数的模式,替换为可学习的函数(通常使用B-样条函数)作用于每个输入维度,然后进行求和。
多层KAN网络通过堆叠这样的层来构建。在实际实现中,每个连接线上的“权重”被替换为可学习的函数。
3.2 基于各种时序建模结构与KAN的融合模型设计
本文提出将KAN层嵌入到各种主流时序建模结构的关键部分,以期提升其非线性建模能力。以下是具体的融合策略:
3.2.1 基于门控循环单元与KAN的融合
-
LSTM-KAN: 在标准的LSTM单元中,门控机制(输入门、遗忘门、输出门)以及细胞状态的更新都涉及线性变换后接激活函数。我们可以将这些线性变换替换为KAN层,或者在线性变换之后、激活函数之前插入KAN层。一种可能的实现是在计算门的激活值和细胞状态更新时,将输入的线性投影通过一个KAN层。
-
BiLSTM-KAN: BiLSTM由一个正向LSTM和一个反向LSTM组成。我们将上述LSTM-KAN的结构应用于正向和反向的LSTM单元。
-
GRU-KAN: GRU结构比LSTM更简单,包含更新门和重置门。
3.2.2 基于时间卷积网络与KAN的融合
- TCN-KAN
: TCN的核心是膨胀因果卷积。在TCN的每个残差块中,通常包含两个膨胀因果卷积层,后面跟着激活函数和Dropout层。我们可以在每个卷积层之后,激活函数之前,插入一个KAN层。另一种方式是将整个残差连接的输出通过一个KAN层。本文选择在每个卷积层之后插入KAN层,以增强卷积特征的非线性表示能力。
output=KAN(Conv1D(input))
3.2.3 基于Transformer与KAN的融合
- Transformer-KAN
: Transformer模型主要由自注意力机制和前馈神经网络组成。我们可以将KAN层引入这两个关键部分。
- 自注意力层中的KAN
: 自注意力机制涉及Query (Q)、Key (K)、Value (V) 的计算,通常通过线性投影实现。
- 前馈神经网络中的KAN
- 自注意力层中的KAN
: Transformer的前馈神经网络通常由两个线性层和一个激活函数(如ReLU)组成。我们可以将线性层替换为KAN层,或者将激活函数替换为一个更灵活的KAN层。一种简单有效的方案是将整个前馈神经网络层替换为一个或多个KAN层。
FFN Output=KAN(Self-Attention Output)
3.3 基于代码修改实现不同模型切换
实现上述各种融合模型并进行对比实验,如果需要为每种模型编写独立的完整代码,将是一个耗时且容易出错的过程。本文的核心贡献之一在于展示如何通过修改模型定义中的一行关键代码,即可在不同的基于KAN的融合模型结构之间进行快速切换。
其核心思想是设计一个通用的模型框架,该框架包含数据预处理、输入层、隐藏层(可以是RNN、CNN、Transformer等模块)、输出层等组件。在隐藏层部分,我们将设计一个可配置的模块,该模块根据传入的参数决定使用哪种具体的结构(如LSTM-KAN、TCN-KAN、Transformer-KAN等)。通过修改这个配置参数,即可实现模型的切换。
四、 讨论
实验结果将为基于KAN的融合模型在共享单车租赁预测领域的应用提供证据。如果融合模型表现出色,可以推断:
-
将KAN的可学习非线性激活函数引入到传统的时序模型中,能够有效增强模型对复杂非线性关系的建模能力,从而提升预测精度。
-
KAN网络的理论上的通用逼近能力在实际应用中得到了验证。
-
通过模块化设计,实现不同结构之间的快速切换是可行的,这为模型的选择和调优提供了便利。
然而,实验结果也可能存在一些局限性:
-
KAN模型的训练相对复杂,对超参数(如B-样条的阶数和网格大小)敏感。需要进行充分的超参数调优。
-
KAN的计算复杂度可能高于传统的固定激活函数(如ReLU),这可能导致训练和推理速度变慢。需要在性能和计算效率之间进行权衡。
-
共享单车租赁数据受到众多外部因素的影响,如何有效地将这些外部特征融入到基于KAN的融合模型中,仍然是一个值得深入研究的问题。
-
KAN的可解释性虽然是其潜在优势,但在复杂的深度学习模型中,对单个KAN层的解释可能不足以全面理解整个模型的行为。需要进一步探索更高级的可解释性方法。
未来的研究可以沿着以下方向展开:
-
探索更优化的KAN结构和训练方法,以提高训练效率和模型性能。
-
将KAN与其他先进技术相结合,例如图神经网络,构建更强大的时空预测模型。
-
深入研究KAN的可解释性,开发更直观的工具和方法来理解模型如何进行预测。
-
将基于KAN的融合模型应用于其他时序预测任务,验证其通用性。
七、 结论
本文系统地探索了将Kolmogorov-Arnold Networks (KANs) 与多种主流时序建模结构(LSTM、BiLSTM、GRU、TCN、Transformer)相结合,构建一系列新型混合模型,并将其应用于共享单车租赁预测。通过对融合模型和基线模型的对比实验,旨在评估不同融合策略的有效性。本文提出的通过修改一行代码实现不同模型切换的设计模式,大大提高了研究效率和代码复用性。
⛳️ 运行结果
🔗 参考文献
[1] 高彦琳.基于深度学习的情感分析研究[D].辽宁科技大学,2019.
[2] 高彦琳,战学刚,迟呈英.基于CNN-LSTM模型的情感分析研究[J].辽宁科技大学学报, 2018, 41(6):6.DOI:CNKI:SUN:ASGT.0.2018-06-012.
[3] 邓全才,徐怀彬.基于BERT-LSTM模型的WebShell文件检测研究[J].网络安全与数据治理, 2024, 43(4):24-27.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP 、 置换流水车间调度问题PFSP、 混合流水车间调度问题HFSP 、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇