Time Series Compressibility and Privacy
在这篇论文中,我们研究了时间序列可压缩性和部分信息隐藏之间的权衡,以及它们的基本含义,即我们应该如何通过扰动它们来引入关于个体值的不确定性。更具体地说,如果扰动不具有与原始数据相同的可压缩性质,则可以对其进行检测和过滤,减少不确定性。这样,通过使扰动与原始数据相似,既可以更好地保存数据的结构,又可以使破坏更加困难。然而,随着数据的可压缩性越来越强,如果真实值被泄露,那么部分不确定性可以被消除,从而揭示出它们是如何受到干扰的。我们将这些概念形式化,研究了真实数据的上述权衡,并开发了切合实际的方案,这些方案能够很好地达到平衡,并且可以扩展到流环境中的实时数据隐藏。
背景:
由于各种原因,尤其是隐私方面的考虑,数据所有者或发布者可能不愿意透露真实的价值。一种被广泛采用和接受的部分信息隐藏方法是基于随机扰动[4],它引入了个体值的不确定性。
特别是:(i)先进的过滤技术可能减少不确定性,从而侵犯隐私; 时间序列可以有很多种方式来描述。在某种意义上,单变量时间序列是一个非常高维空间[1]中的一个点;(iii)时间序列特征可能随时间而变化,在流式环境中,旧模式可能变化,新模式可能出现。
在本文中,我们关注单变量时间序列,研究了通过数据扰动隐藏部分信息的方法的权衡,并提出了一个实用的方法,我们评估过滤攻击和真值泄漏。此外,我们的方法适合于时间演进(即非平稳)序列,并可适用于流设置中的动态数据隐藏。