利用约束优化技术实现自动化最近邻搜索配置|ICLR2023

最新推荐文章于 2024-09-15 08:03:51 发布

向量检索实验室

最新推荐文章于 2024-09-15 08:03:51 发布

阅读量122

点赞数

文章标签：数据库 ai 人工智能图搜索算法 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TensorSearch/article/details/129683887

版权

本文介绍了如何使用约束优化技术自动配置最近邻搜索算法，以达到在高召回率和吞吐量之间的平衡。通过预估召回率和吞吐量，文章提出了一种降低计算开销并获得优良性能参数配置的方法，实验结果显示其性能接近精确网格搜索，优于黑盒优化。

摘要由CSDN通过智能技术生成

摘要

本篇文章分享了《Automating Nearest Neighbor Search Configuration with Constrained Optimization》这一篇关于自动化最近邻搜索配置的研究论文，主要探讨了如何使用约束优化技术来自动配置基于量化的最近邻搜索算法。

一、研究背景

能否解决billion-scale的问题是ANNS算法从理论到工程落地的一个重要衡量标准。在面对billion-scale的问题时，单一的索引结构已经显得“力不从心”，因此向量索引开始展示出了由单一结构向多层结构、融合索引过渡的趋势。可以类比深度学习技术，从逻辑回归到多层感知机再到现在风靡的大模型，数据量剧增势必需要更复杂的数据结构来构建高效索引。如下图，文中给出了一个多层量化索引的例子，在billion-scale的数据集上比较了层数更多更复杂的索引结构（Original）与其两个简化版本（Shallow-Small、Shallow-Large）的检索效果。可以明显看出，结构更复杂的索引在召回率和吞吐量两个角度都表现出了明显的优势。

随着索引结构的复杂化，其参数量也随之成倍增长，不同参数配置带来的效果变化更是成几何倍数增加。目前主流的参数配置手段有：

网格搜索：遍历所有参数配置可能，虽然能得到最优解，但是计算开销庞大，不切实际；

人工调参：以工程师丰富的经验来配置参数，这种方法会花费大量人力，且受工程师的经验所限，效果参差；

黑盒优化：利用优化器来探索参数配置，这种方法同样需要大量计算，且经常只能得到次优解，差强人意。

最低0.47元/天解锁文章

向量检索实验室

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

向量检索实验室 CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

162万+: 周排名

81万+: 总排名

4223: 访问

: 等级

51: 积分

2: 粉丝

1: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

分类专栏

论文分享 2篇

最新评论

可计算存储结构加速大规模数据处理
CSDN-Ada助手: 非常感谢您的分享，这篇博客看起来非常有趣！恭喜您持续创作，希望您能够继续分享您的经验和见解。下一步的创作建议是，如果您可以在博客中提供更多实际的案例和具体的技术细节，那么读者将更容易理解和应用您的思路。谢谢您的分享！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
GPU 加速图索引构建和搜索|ICDE2022
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录。
嗯？大火的ChatGPT和new bing都离不开它？
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)使用标准目录。
利用约束优化技术实现自动化最近邻搜索配置|ICLR2023
CSDN-Ada助手: 如果云原生非常成功，是否运维的工作就会被替代？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。