摘要
本文主要介绍cassandra中的索引,物化视图,有些知识点需要对cassandra有基本的认识才能理解。比如数据在cassandra节点中如何分布。如果有不明白的地方可以看本专栏之前文章。或者发送邮件和我探讨 cnstonefang@gmail.com。
为什么叫secondary index
CREATE TABLE user(
id bigint,
name text,
email text,
PRIMARY KEY(id)
);
在很多文档中可以看到cassandra index又被称为secondary index.这是相对primary index的概念。在创建上述user table 时,会根据primary key 默认创建 primary index,基于id 列。可以根据id来查询用户的信息。但是不同于关系型数据库。你没法根据email反向查id.为了实现这样的查询,可以基于email创建secondary index.
CREATE INDEX email_index ON user(email);
当你创建索引的时候,cassandra 会创建一个隐藏table来存储数据
CREATE TABLE email_index(
email text,
id bigint,
PARMARY KEY(text,id)
);
secondary index 的这张表的信息是local aware的。和节点的数据存放在一起。而primary index是global.所以当你根据primary index columns 来查询的时候,cassandra ring 环上的每个节点都是知道数据是存储在哪些节点上的。但是如果根据secondary index columns 来查询。ca