一、类型及区分
Cassandra的4种Key
- Primary Key 主键
- Composite Key,Compound Key 复合键
- Partition Key 分区键
- Clustering Key 集群
1.主键 Primary Key(简单主键)
- 是用来获取某一行的数据, 可以是单一列(Single column Primary Key)或者多列(Composite Primary Key)。
- 在 Single column Primary Key 决定这一条记录放在哪个节点。
例:Student_id是student的主键
create table student (Student_id int primary key, Sname text, Sbirth timestamp, Snum text, Sphone text );
查询后会发现主键和普通键的颜色不一样。
2.复合键 Composite Primary Key
- 如果 Primary Key 由多列组成,那么这种情况称为 Compound Primary Key 或 Composite Primary Key。
查询testtab,会发现key_one和key_two 的颜色与其他列不一样
复合主键由主键中引用的一个或多个列组成。复合主键的一个组件称为分区键,而另一个组件称为分簇列。以下是主键的不同变化。请注意,C1、C2、C3,…等表示表中的列。
- C1:主键只有一个分区键,没有分簇列。
- (C1,C2):列C1是分区键,列C2是分簇列。
- (C1,C2,C3,…):列C1是分区键,列C2,C3等构成分簇列。
- (C1,(C2,C3,…)):与3相同,即C1列是分区键,C2,C3…列构成分簇列。
- ((C1,C2),C3),C1,C2,C3作为复合主键,C1,C2作为复合的分区键,C3作为分簇键
- (((C1,C2,…),(C3,C4,…))):列C1,C2作分区键,列C3,C4,…作分簇列。
需要注意的是,当复合键是 C1、C2、C3 时,第一个键C1 将成为分区键,其余键成为集群键的一部分。为了制作复合分区键,我们必须在括号中指定键,例如:((C1,C2),C3,C4)。在这种情况下,C1 和 C2 是分区键的一部分,C3 和 C4 是集群键的一部分。
3.分区键 Partition Key
- 在组合主键的情况下(上面的例子),第一部分称作Partition Key(key_one就是partition key),第二部分是clustering key(key_two)
- Cassandra会对Partition key 做一个hash计算,并自己决定将这一条记录放在哪个节点。
- 如果 Partition key 由多个字段组成,称之为 Composite Partition key
例:
create table testTab (
key_part_one int,
key_part_two int,
key_clust_one int,
key_clust_two int,
key_clust_three uuid,
name text,
PRIMARY KEY((key_part_one,key_part_two), key_clust_one, key_clust_two,key_clust_three)
查询后会发现分区键,集群键和普通键的颜色不一样。
分区键在assandra中具有特殊用途,除了显示数据库中记录的独特性。另一个目的,即在分布式系统中非常关键的一个目的是确定数据位置。当数据插入集群时,第一步是在分区键上应用哈希功能。输出用于确定哪个节点(和副本)将获取数据。阿帕奇·卡桑德拉使用的算法使用Murmur3,这将采取任意输入,并创建一致的令牌值。该令牌值将属于单个节点拥有的令牌范围。简言之,分区键始终属于一个节点,该分区的数据始终位于该节点上。为什么这很重要?如果没有分区数据的绝对位置,则需要搜索集群中的每个节点以查找您的数据。在小集群中,这可能很快完成,但在更大的集群中,速度会非常缓慢。
4. 集群-分簇列(Clustering Key)
- 分簇列的目的是按排序顺序存储行数据。数据排序基于列,列包含在聚类密钥中。此排列可高效使用聚类密钥检索数据。
create table test_demo (name text,No int,phone list<text>,primary key(name,No))
with clustering order by (No desc)
// 定义分列簇为No,并说明分列簇按降序排序(DESC),升序为(ASC)
由于cassandra 底层采用键值对数据结构,因此,理论上主键、分区键和分簇键都属于行键的一部分
Example:
-
创建键空间
-
切换到students_details键空间:
-
创建一个表,其中包含有关任何学生的一般信息。student
-
向表中插入数据
-
使用 cqlsh 中的扩展命令,我们可以查看查询的详细信息。在没有参数的扩展中显示扩展设置的当前值。
- 注意如果扩展关闭(disable),要开启它(expand on),关闭为(expand off)
- 然后查看插入上述详细信息(研究将以 cqlsh 中的红色呈现,代表主键/行键)
- 从上述输出中,我们可以看到num已成为行键,并且它标识了单个行。
我们可以看到有三个tokens。
- 我们可以使用主键中的列来过滤
二、参考文章
https://dzone.com/articles/cassandra-data-modeling-primary-clustering-partiti
https://www.datastax.com/blog/2016/02/most-important-thing-know-cassandra-data-modeling-primary-key