Azure机器学习推时间序列推荐新功能

微软云端机器学习服务,推出时间序列推荐新功能,包括了新的预测函式、时间序列交叉验证(Rolling Origin Cross Validation)以及时间窗口聚合功能等,除了能减少预测模型可能发生的误差外,也套用新的模型特征增加预测精准度。用户在处理时间序列资料时,根据预测应用的情境不同,需要更缜密地考虑数据的状态,像是可能需要针对每个预测重新训练模型,或是克服历史数据存在断层的状况(下图),而微软新加入的预测函式,是一种检索预测值的新方法,能够解决以上的问题。

物联网的应用常会遇到训练与预测数据存在差距的状况,而使得训练出来的模型变得不精准,微软解释,资料的变化应该反映在模型训练上,但对于物联网这类高频率的应用,传感器的数据不断变化,且受外部影响甚巨,因此实时重新训练模型显得不切实际。而新的预测函式则可以让用户新增近期预测上下文(Prediction Context),自动修正因数据断层带来的模型预测误差,内插必要的训练与预测上下文。在时间序列数据验证上,微软为用户提供了时间序列交叉验证功能,微软表示,交叉验证是量测和减少模型采样错误的重要程序,但当数据进行分区(Partitioning)却不考虑时间因素,可能导致预测错误,因为在时间序列数据上,必须确保测试的数据仅能使用过去的值。 而使用时间序列交叉验证作为评估时间序列数据的机器学习标准方法,会使用一个原始时间点(Origin Time Point)切开训练和验证数据,藉由滑动原始时间点产生交叉验证折迭,以确保数据正确的顺序。时间序列交叉验证会在预测功能中自动应用,用户只需要传递训练和验证数据,以及想要进行交叉验证的折数即可。时间序列推荐功能中,也增加了滞后(Lags)和时间窗口聚合以增加预测的精确度,在Azure机器学习服务中的自动化机器学习,用户现在可以指定目标滞后作为模型的一种特征,并设定数据滞后的时间区间长度。另外,用户可能可以需要设定一个时间窗口,以聚合时间窗口中的数值,对于预测能源需求的这类应用特别有用,用户可以将时间窗口设定为三天(下图),将不同的影响因素都纳入考虑。微软提到,滞后与累加功能,能提供额外的数据特征,因此可在提升模型的准确性。

针对销售等容易受假日影响的预测应用,微软新增了假日功能,系统可以在现存的数据集中,为每一个假日创建一个窗口,用于精确的预测假日对模型的影响,微软表示,由于假日对于特定应用影响很大,行为模式甚至与平常日子完全不同,因此现在支持110个国家超过两千个节日,用户只要在时间序列设定中,输入国家代码,系统便会自动修正模型在假日中的行为。

转载于:https://juejin.im/post/5cff5e29e51d454f6f16ebbe

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值