Fair Near Neighbor Search: Independent Range Sampling in High Dimensions

最新推荐文章于 2024-06-13 14:43:16 发布

西西弗的小蚂蚁

最新推荐文章于 2024-06-13 14:43:16 发布

阅读量115

点赞数 1

分类专栏：各类数据结构文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj_18706809267/article/details/126923452

版权

各类数据结构专栏收录该内容

93 篇文章 0 订阅

订阅专栏

相似性搜索是一种基本的算法，广泛应用于计算机科学的许多领域。相似性搜索问题有几种变体，其中最相关的是r-近邻(r- nn)问题:给定半径r ,构造一个数据结构，对于任意给定的查询点q，返回一个距离q不超过r的点p。本文从公平性角度研究r- nn问题。我们从机会均等的角度来考虑公平性:距离查询距离r以内的所有点都应该有相同的概率被返回。在低维情况下，Hu, Qiao, and Tao (PODS 2014)首先研究了该问题。局部性敏感哈希(Locality sensitive hashing, LSH)是高维空间中理论上最强的相似性搜索算法，但它不能提供这种公平性保证。为解决这个问题，本文为r-NN提出了有效的数据结构，其中S中所有靠近q的点都具有相同的概率被选择并由查询返回。首先提出一种黑盒方法，给定任何LSH方案，为查询邻域内均匀采样点构造数据结构。然后，提出了一种基于局部敏感过滤器和近似线性空间的公平内积相似搜索数据结构。本文最后进行了实验评估，强调了在真实数据集上的推荐设置中的公平性，并讨论了通过解决该问题的其他变体而引入的固有不公平性。

西西弗的小蚂蚁

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Fair Near Neighbor Search: Independent Range Sampling in High Dimensions

本文从公平性角度研究r- nn问题。我们从机会均等的角度来考虑公平性:距离查询距离r以内的所有点都应该有相同的概率被返回。本文最后进行了实验评估，强调了在真实数据集上的推荐设置中的公平性，并讨论了通过解决该问题的其他变体而引入的固有不公平性。，本文为r-NN提出了有效的数据结构，其中S中所有靠近q的点都具有相同的概率被选择并由查询返回。给定半径r ,构造一个数据结构，对于任意给定的查询点q，返回一个距离q不超过r的点p。相似性搜索问题有几种变体，其中最相关的是r-近邻(r- nn)问题。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。