cassandra表中主键的类型

最新推荐文章于 2024-06-06 16:02:00 发布

Lang-1210

最新推荐文章于 2024-06-06 16:02:00 发布

阅读量2.5k

点赞数 27

分类专栏：笔记文章标签：数据库大数据 sql

本文链接：https://blog.csdn.net/m0_48654636/article/details/117795188

版权

笔记专栏收录该内容

9 篇文章 0 订阅

订阅专栏

cassandra表中主键的类型及区分？

一、类型及区分
二、参考文章

在这里插入图片描述

一、类型及区分

Cassandra的4种Key

Primary Key 主键
Composite Key，Compound Key 复合键
Partition Key 分区键
Clustering Key 集群

1.主键 Primary Key(简单主键)

是用来获取某一行的数据，可以是单一列（Single column Primary Key）或者多列（Composite Primary Key）。
在 Single column Primary Key 决定这一条记录放在哪个节点。

例：Student_id是student的主键

create table student (Student_id int primary key, Sname text, Sbirth timestamp, Snum text, Sphone text );

查询后会发现主键和普通键的颜色不一样。
在这里插入图片描述

2.复合键 Composite Primary Key

如果 Primary Key 由多列组成，那么这种情况称为 Compound Primary Key 或 Composite Primary Key。

查询testtab，会发现key_one和key_two 的颜色与其他列不一样在这里插入图片描述

复合主键由主键中引用的一个或多个列组成。复合主键的一个组件称为分区键，而另一个组件称为分簇列。以下是主键的不同变化。请注意，C1、C2、C3,…等表示表中的列。

C1：主键只有一个分区键，没有分簇列。
（C1，C2）：列C1是分区键，列C2是分簇列。
（C1，C2，C3，…）：列C1是分区键，列C2，C3等构成分簇列。
（C1，（C2，C3，…））：与3相同，即C1列是分区键，C2，C3…列构成分簇列。
（（C1，C2），C3），C1，C2，C3作为复合主键，C1，C2作为复合的分区键，C3作为分簇键
（（（C1，C2，…），（C3，C4，…）））：列C1，C2作分区键，列C3，C4，…作分簇列。

需要注意的是，当复合键是 C1、C2、C3 时，第一个键C1 将成为分区键，其余键成为集群键的一部分。为了制作复合分区键，我们必须在括号中指定键，例如：（（C1，C2），C3，C4）。在这种情况下，C1 和 C2 是分区键的一部分，C3 和 C4 是集群键的一部分。

3.分区键 Partition Key

在组合主键的情况下(上面的例子)，第一部分称作Partition Key（key_one就是partition key），第二部分是clustering key（key_two）
Cassandra会对Partition key 做一个hash计算，并自己决定将这一条记录放在哪个节点。
如果 Partition key 由多个字段组成，称之为 Composite Partition key

例：

create table testTab (
	key_part_one int,
	key_part_two int,
	key_clust_one int,
	key_clust_two int,
	key_clust_three uuid,
	name text,
PRIMARY KEY((key_part_one,key_part_two), key_clust_one, key_clust_two,key_clust_three)

查询后会发现分区键，集群键和普通键的颜色不一样。
在这里插入图片描述

分区键在assandra中具有特殊用途，除了显示数据库中记录的独特性。另一个目的，即在分布式系统中非常关键的一个目的是确定数据位置。当数据插入集群时，第一步是在分区键上应用哈希功能。输出用于确定哪个节点（和副本）将获取数据。阿帕奇·卡桑德拉使用的算法使用Murmur3，这将采取任意输入，并创建一致的令牌值。该令牌值将属于单个节点拥有的令牌范围。简言之，分区键始终属于一个节点，该分区的数据始终位于该节点上。为什么这很重要？如果没有分区数据的绝对位置，则需要搜索集群中的每个节点以查找您的数据。在小集群中，这可能很快完成，但在更大的集群中，速度会非常缓慢。

4. 集群-分簇列(Clustering Key)

分簇列的目的是按排序顺序存储行数据。数据排序基于列，列包含在聚类密钥中。此排列可高效使用聚类密钥检索数据。

create table test_demo (name text,No int,phone list<text>,primary key(name,No))  
with clustering order by (No desc)
//  定义分列簇为No，并说明分列簇按降序排序(DESC),升序为(ASC)

由于cassandra 底层采用键值对数据结构，因此，理论上主键、分区键和分簇键都属于行键的一部分

Example: