- 博客(5)
- 收藏
- 关注
原创 【无标题】
本篇论文来自于 SIGMOD 2023,介绍了一种可靠和有效的距离比较操作的高维近似最近邻搜索。主要工作1.提出一种随机算法 ADSampling; 2.基于 ADSampling ,开发了两种算法特定的技术作为插件来增强现有的 AKNN 算法。
2023-04-18 16:44:02
140
原创 可计算存储结构加速大规模数据处理
在大规模数据场景中,由于基于图的高维向量索引结构需要占用极大的内存空间,现有研究将图索引结构存储在SSD中,以减少内存空间的占用,但是这些方案会造成显著的I/O开销和性能损失。本次分享将分析可计算存储的架构特性,介绍可计算存储与大规模ANN结合的前沿学术进展Vstore,并对未来的研究进行展望。
2023-04-12 15:37:07
189
1
原创 GPU 加速图索引构建和搜索|ICDE2022
本篇文章来自于ICDE2022,主要工作是提供了 GPU 加速图索引构建和搜索,相比 CPU 以及 GPU 方案 SONG 性能有了更大的提升,更加的充分的利用了线程块内部线程的并行和线程块之间的并行。
2023-03-23 16:48:03
251
1
原创 嗯?大火的ChatGPT和new bing都离不开它?
本文是对 WhalePaper 向量检索领域第一次直播活动内容的文字版,会对向量检索这个 ChatGPT 和 new bing 都离不开的技术进行介绍,结合了 ChatGPT 以及 new bing 的应用场景进行讲解,相信被标题骗进来的你还真能有所收获的(手动狗头)!本期内容入门友好,对课件进行了一些注解,图文结合在一起全是干货,长文预警!
2023-03-21 11:04:52
3421
1
原创 利用约束优化技术实现自动化最近邻搜索配置|ICLR2023
本篇文章分享了《Automating Nearest Neighbor Search Configuration with Constrained Optimization》这一篇关于自动化最近邻搜索配置的研究论文,主要探讨了如何使用约束优化技术来自动配置基于量化的最近邻搜索算法。数据量激增到亿万级别的如今,向量索引的结构也愈发地趋于复杂。本文以易懂的数学方式合理地计算出权衡召回率和吞吐量的索引参数配置。
2023-03-21 10:58:21
107
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人