The Price of Tailoring the Index to Your Data: Poisoning Attacks on Learned Index Structures (2022)

最新推荐文章于 2024-07-20 20:04:43 发布

西西弗的小蚂蚁

最新推荐文章于 2024-07-20 20:04:43 发布

阅读量99

点赞数 3

分类专栏： DBSCAN算法文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_18706809267/article/details/125413102

版权

DBSCAN算法专栏收录该内容

33 篇文章 0 订阅

订阅专栏

本文探讨了将机器学习应用于数据库索引的新视角，提出了针对学习索引结构的中毒攻击方法，特别关注了累积分布函数(CDF)训练模型的安全风险。研究发现，递归模型索引(RMI)在攻击下性能下降明显。

摘要由CSDN通过智能技术生成

学习索引结构的概念依赖于这样一种思想:数据库索引的输入-输出功能可以被视为一个预测任务，因此，使用机器学习模型而不是传统的算法技术来实现。从这个新奇的角度研究几十年前的问题，在机器学习和数据结构的交叉领域激发了令人兴奋的结果。然而，学习索引结构的优势，即通过底层ml模型调整手头数据的能力，从安全性角度来看可能成为缺点，因为它可能被利用。

在这项工作中，我们提出了第一个中毒攻击学习索引结构的研究。所需要的中毒方法不同于以往的所有工作，因为受到攻击的模型是在累积分布函数(CDF)上训练的，因此，训练集上的每次注射都对多个数据值产生级联影响。我们对训练在CDF上的线性回归模型进行了第一次中毒攻击，CDF是提出的学习索引结构的基本构建块。我们将中毒技术推广到一种更高级的两阶段学习索引结构设计，称为递归模型索引(RMI)，它已被证明优于传统的b -树。我们在模型的各种参数化下评估了我们对真实世界和合成数据集的攻击，表明RMI的误差增加到300，其第二阶段模型的误差增加到3000。

西西弗的小蚂蚁

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
The Price of Tailoring the Index to Your Data: Poisoning Attacks on Learned Index Structures (2022)

学习索引结构的概念依赖于这样一种思想:数据库索引的输入-输出功能可以被视为一个预测任务，因此，使用机器学习模型而不是传统的算法技术来实现。从这个新奇的角度研究几十年前的问题，在机器学习和数据结构的交叉领域激发了令人兴奋的结果。然而，学习索引结构的优势，即通过底层ml模型调整手头数据的能力，从安全性角度来看可能成为缺点，因为它可能被利用。我们在模型的各种参数化下评估了我们对真实世界和合成数据集的攻击，表明RMI的误差增加到300，其第二阶段模型的误差增加到3000。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。