索引大数据：分布式数据库中的全局索引与本地索引

最新推荐文章于 2024-08-10 07:56:58 发布

瞠目结舌2

最新推荐文章于 2024-08-10 07:56:58 发布

阅读量2k

点赞数

文章标签：数据分布式数据库全局索引本地索引

本文链接：https://blog.csdn.net/qq_34043987/article/details/80123347

版权

在大数据时代，索引和查询面临巨大挑战。分布式数据库通常采用本地索引和全局索引两种模式。本地索引优化了快速查询，但在大规模集群和高数据摄取下可能造成延迟。全局索引则独立于数据分区，提供更快的查询响应，适合实时查询需求。Couchbase Server等数据库提供了全局二级索引的解决方案，通过独立部署实现索引服务，降低查询延迟。

摘要由CSDN通过智能技术生成

毫无疑问，目前大数据的索引和查询是相当具有挑战性的。大数据的特点有高速、价值、多样和大数据量！100KS每秒更新的速度和TBs的数据扫描，让你不能很好的做实时，除非你有坚实的索引！想象一下这些应用程序：

旅游应用程序，能让你看到所有航班和酒店的定价和记录！
在线游戏，能显示顶级球员的准确记分牌！
欺诈检测应用程序，需要看你最近的动态来决定进行信用卡交易是否合法！

这些都是使用情况的查询，需要处理高摄取数据，但不能妥协毫秒的响应时间！如果你不能提供旅游路线、记分牌，或应对实时的诈骗行为，所有的都会关闭！好吧，这听起来好像不太可能，并且你会问：“如何索引和查询这类型的实时数据呢？”

全局索引和本地索引

分布式系统提供两种类型的索引模型：

本地索引：在集群中，每个节点索引的数据在本地上进行。这为快速索引进行了优化。然而随着数据摄取的增加，本地索引维护与传入的工作量，以及集群变大(节点)分散收集的点击查询会受到延迟。想象一下这个查询：“找到8月份十大最活跃用户”

#SQL would look something like this

SELECT customer_name, total_logins.jan_2015 

FROM customer_bucket

最低0.47元/天解锁文章

瞠目结舌2

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫