Cassandra Secondary Index 介绍

最新推荐文章于 2021-10-10 14:48:18 发布

方丈的寺院

最新推荐文章于 2021-10-10 14:48:18 发布

阅读量5.9k

点赞数

分类专栏： NoSql cassandra 详解文章标签： cassandra index 视图索引

本文链接：https://blog.csdn.net/FS1360472174/article/details/52733434

版权

本文详细介绍了Cassandra中的Secondary Index，包括其原理、查询方式、使用场景以及与物化视图和新表的区别。Secondary Index适用于高值范围的列，但不适合频繁更新或删除的列。查询时，结合Partition Key可提高效率。

摘要由CSDN通过智能技术生成

摘要

本文主要介绍cassandra中的索引，物化视图，有些知识点需要对cassandra有基本的认识才能理解。比如数据在cassandra节点中如何分布。如果有不明白的地方可以看本专栏之前文章。或者发送邮件和我探讨 cnstonefang@gmail.com。

为什么叫secondary index

CREATE TABLE user(
    id bigint,
    name text,
    email text,
    PRIMARY KEY(id)
);

在很多文档中可以看到cassandra index又被称为secondary index.这是相对primary index的概念。在创建上述user table 时，会根据primary key 默认创建 primary index，基于id 列。可以根据id来查询用户的信息。但是不同于关系型数据库。你没法根据email反向查id.为了实现这样的查询，可以基于email创建secondary index.

CREATE INDEX email_index ON user(email);

当你创建索引的时候，cassandra 会创建一个隐藏table来存储数据

CREATE TABLE email_index(
   email text,
   id  bigint,
   PARMARY KEY(text,id)
);

secondary index 的这张表的信息是local aware的。和节点的数据存放在一起。而primary index是global.所以当你根据primary index columns 来查询的时候，cassandra ring 环上的每个节点都是知道数据是存储在哪些节点上的。但是如果根据secondary index columns 来查询。ca