The Price of Tailoring the Index to Your Data: Poisoning Attacks on Learned Index Structures (2022)

本文探讨了将机器学习应用于数据库索引的新视角,提出了针对学习索引结构的中毒攻击方法,特别关注了累积分布函数(CDF)训练模型的安全风险。研究发现,递归模型索引(RMI)在攻击下性能下降明显。
摘要由CSDN通过智能技术生成

学习索引结构的概念依赖于这样一种思想:数据库索引的输入-输出功能可以被视为一个预测任务,因此,使用机器学习模型而不是传统的算法技术来实现。从这个新奇的角度研究几十年前的问题,在机器学习和数据结构的交叉领域激发了令人兴奋的结果。然而,学习索引结构的优势,即通过底层ml模型调整手头数据的能力,从安全性角度来看可能成为缺点,因为它可能被利用。

在这项工作中,我们提出了第一个中毒攻击学习索引结构的研究。所需要的中毒方法不同于以往的所有工作,因为受到攻击的模型是在累积分布函数(CDF)上训练的,因此,训练集上的每次注射都对多个数据值产生级联影响。我们对训练在CDF上的线性回归模型进行了第一次中毒攻击,CDF是提出的学习索引结构的基本构建块。我们将中毒技术推广到一种更高级的两阶段学习索引结构设计,称为递归模型索引(RMI),它已被证明优于传统的b -树。我们在模型的各种参数化下评估了我们对真实世界和合成数据集的攻击,表明RMI的误差增加到300,其第二阶段模型的误差增加到3000。 

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值