Cassandra 集群部署

部署的服务器:

192.168.131.172
192.168.131.173
192.168.131.174

步骤:1 配置java运行环境

首先检查服务器上是否安装java运行环境,可直接运行如下命令检查:

java -version

如果安装了的话,会显示当前java的版本,反之则说明该机器没有安装java的运行环境,需安装java的运行环境。

相关命令:yum install java

步骤2:安装cassandra数据库

下载Cassandra数据库到本地:

相关命令:wget http://www.apache.org/dyn/closer.cgi?path=/cassandra/1.2.5/apache-cassandra-1.2.5-bin.tar.gz

解压:tar -zxvf apache-cassandra-1.2.5-bin.tar.gz

重命名Cassandra目录名:mv apache-cassandra-1.2.5 cassandra

至此,Cassandra已安装完成。

配置Cassandra:

Cassandra是在第一次运行的时候,就将所有的配置文件读取完成,下次就不再从配置文件读取,所有需保证在运行Cassandra之前Cassandra的配置必须都是正确的。

如果启动Cassandra后,发现配置有错误,需将Cassandra启动产生的所有数据都删除,数据的存储目录默认在:/var/lib/cassandra

执行删除命令:rm -rf *

需配置的地方:1> 集群名

cluster_name: 'Cluster_1'

集群的所有节点的集群名必须是一样的,这是必须。


2> initial_token:此值是根据一定的算法得出的,也是

非常重要切比较有意思的地方,设置此值的目的是让集群的节点可以均衡的负载,如果不为该标识赋值的话,则Cassandra启动后,会默认为该token付值,但是却保证不了集群中节点的均衡负载(平均分配)算法如下:

将该命令拷贝至linux,回车,会输出通过该算法计算而得的3个token值,将这3个值分别配置到上述的3个节点上。这样就保证了对于存入cassandra中数据的平均分配。

python -c 'print [str(((2**64 / 6) * i) - 2**63) for i in range(6)]'

根据不同的节点数,自行修改。上面是打印出6个节点的代码。如果是3个的话,则如下:

python -c 'print [str(((2**64 / 3) * i) - 2**63) for i in range(3)]'

seeds:集群的节点,这里需要把集群的所有节点的Ip写在这里,节点之间用“,”(逗号)隔开

listen_address:本机ip

rpc_address: 0.0.0.0

==============================================

为了便于操作和维护,我们可以把不同的节点的服务器名都根据自己的Ip修改下,便于分辨。

比如192.168.131.172 ,默认的hostname为localhost,我们可以改为“CENTOS131172”.

如果确实这样改过了,则该节点的host也需增加相关解析,如下:


上面的图,显示的是我将3个节点的hostname都改过了,并在各自的节点的hosts里都增加对集群其他节点的解析。

相关参考命令:

ps ax|grep cassandra 检查cassandra运行pid

echo CENTOS131172 > /proc/sys/kernal/hostname 修改主机名

cassand 数据存储位置:/var/lib/cassandra


Cassandra 是一个开源的分布式数据库系统,它被设计成高度可扩展、高性能的系统,用于处理大规模数据集。在 Cassandra 中,数据分布在整个集群中的多个节点上,每个节点都具有相同的功能和数据副本。 下面是一些关于 Cassandra 集群的常见操作和概念: 1. 节点(Node):Cassandra 集群中的每个服务器都被称为节点。每个节点都可以独立地处理读写请求,并且都存储了部分数据的副本。 2. 数据中心(Datacenter):Cassandra 集群可以由多个数据中心组成。数据中心是逻辑上划分的部分,每个数据中心可以包含一个或多个节点。 3. 复制因子(Replication Factor):复制因子是指每个数据中心中为每个数据副本存储的节点数量。它决定了数据在集群中的冗余程度和可靠性。 4. 键空间(Keyspace):键空间是 Cassandra 中存储数据的顶层容器,类似于传统数据库中的数据库。它定义了数据的复制策略、复制因子等。 5. 分区(Partition):Cassandra 使用分区键将数据分布在不同的节点上。分区键是用于确定数据在集群中哪个节点存储的关键属性。 6. 一致性级别(Consistency Level):一致性级别定义了读写操作需要满足的数据一致性要求。Cassandra 提供了不同的一致性级别供选择,例如 ONE、QUORUM、ALL 等。 7. 启动和管理节点:要启动和管理 Cassandra 集群的节点,可以使用 Cassandra 提供的命令行工具 `cassandra`、`nodetool` 和 `cqlsh`。些工具提供了管理节点、执行查询和维护集群的功能。 请注意,Cassandra 集群部署和管理是一个复杂的主题,涉及到许多方面的配置和调优。在实际应用中,建议参考官方文档或专业资源来进行详细了解和操作。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值