《Multi‐similarity measurement driven ensemble just‐in‐time learning for soft sensing of industrial processes》‘’
论文地址:https://onlinelibrary.wiley.com/doi/pdf/10.1002/cem.3040
3 集成JITL框架
如前所述,样本之间存在多种相似度。对于不同的数据集,它们的样本相似关系可能不同。这取决于过程的性质。在某些情况下,欧几里德距离可能是某些数据集的正确相似性,而角度相关可能是某些其他数据集的真实相似性。而且,很难获得大多数过程数据的实际相似性的知识。因此,单个相似性测量可能不足或有时甚至无法捕获数据样本之间的真实相似性结构。为了缓解这个问题,利用多个相似性测量来评估样本相似性,找到用于局部建模的相关样本以及融合局部建模结果更为合适。因此,通过在本节中采用多个相似性测量来提出集成JITL框架。通过不同的相似度测量,当查询样本到来时,将从历史数据集中选择不同的相关样本组。在每组相关样本中,构建并训练局部模型以预测该查询样本的输出。之后,通过组合来自由所有组的相关样本训练的局部模型的所有预测值来获得最终集成预测。 E-JITL的详细过程可以描述如下。
1.从过程中收集历史输入和输出样本,可以表示为。
2.预定义用于样本选择的相似性测量类型。如果有K种相似性指数,我们可以将它们表示为。此外,选择权重函数来量化相似性。确定在每个相似性测量
下为每个查询样本选择相关样本的数量的标准。最简单的方法是选择具有最大相似权重的
训练样本。
3.当查询样本到来时,针对每个相似性度计算所有历史样本的相似度权重。对于相似度
,针对历史样本计算的权重是
。通过降低权重的重新排序,可以确定局部相关样本。假设相关的输入和输出样本表示为