机器学习预测时间序列 特征值怎么确定_微软Azure云端机器学习服务正式推出时间序列预测功能...

微软云端机器学习服务推出了新功能,包括预测函式、时间序列交叉验证和时间视窗聚合,旨在减少预测误差并增强预测模型的准确性。新预测函式能解决资料断层问题,时间序列交叉验证确保正确的时间顺序,而滞后和时间视窗聚合功能则提升了预测精度。此外,还引入了假日功能,考虑了节假日对预测的影响,支持多个国家的节日,提高模型在特殊日期的预测效果。
摘要由CSDN通过智能技术生成

微软云端机器学习服务,推出时间序列推荐新功能,包括了新的预测函式、时间序列交叉验证(Rolling Origin Cross Validation)以及时间视窗聚合功能等,除了能减少预测模型可能发生的误差外,也套用新的模型特征增加预测精准度。

用户在处理时间序列资料时,根据预测应用的情境不同,需要更缜密地考察资料的状态,像是可能需要针对每个预测重新训练模型,或是克服历史资料存在断层的状况(下图),而微软新加入的预测函式,是一种检索预测值的新方法,能够解决以上的问题。

a18793d37cc5d4e09d81f8363de2ce31.png

物联网的应用常会遇到训练与预测资料存在差距的状况,而使得训练出来的模型变得不精准,微软解释,资料的变化应该反映在模型训练上,但对于物联网这类高频率的应用,感测器的资料不断变化,且受外部影响甚巨,因此即时重新训练模型显得不切实际。而新的预测函式则可以让用户新增近期预测上下文(Prediction Context),自动修正因资料断层带来的模型预测误差,内插必要的训练与预测上下文。

在时间序列资料验证上,微软为用户提供了时间序列交叉验证功能,微软表示,交叉验证是量测和减少模型采样错误的重要程序,但当资料进行分区(Partitioning)却不考察时间因素,可能导致预测错误,因为在时间序列资料上,必须确保测试的资料仅能使用过去的值。

997eb1db6006420490be1bd3303a3eee.png

而使用时间序列交叉验证作为评估时间序列资料的机器学习标准方法,会使用一个原始时间点(Origin Time Point)切开训练和验证资料,藉由滑动原始时间点产生交叉验证折叠,以确保资料正确的顺序。时间序列交叉验证会在预测功能中自动应用,用户只需要传递训练和验证资料,以及想要进行交叉验证的折数即可。

时间序列推荐功能中,也增加了滞后(Lags)和时间視窗聚合以增加预测的精确度,在Azure机器学习服务中的自动化机器学习,用户现在可以指定目标滞后作为模型的一种特征,并设定资料滞后的时间区间长度。另外,用户可能可以需要设定一个时间視窗,以聚合时间視窗中的数值,对于预测能源需求的这类应用特别有用,用户可以将时间視窗设定为三天(下图),将不同的影响因素都纳入考察。微软提到,滞后与累加功能,能提供额外的资料特征,因此可在提升模型的准确性。

972de5e7baec19dcb0a13bb1917dd283.png

针对销售等容易受假日影响的预测应用,微软新增了假日功能,系统可以在现存的资料集中,为每一个假日创建一个视窗,用于精确的预测假日对模型的影响,微软表示,由于假日对于特定应用影响很大,行为模式甚至与平常日子完全不同,因此现在支持110个国家超过两千个节日,用户只要在时间序列设定中,输入国家代码,系统便会自动修正模型在假日中的行为。

资料来源:iThome

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值