五、CASSANDRA集群节点缩扩容

最新推荐文章于 2022-03-19 17:49:01 发布

置顶 zwq00451

最新推荐文章于 2022-03-19 17:49:01 发布

阅读量1.3k

点赞数

分类专栏： cassandra 文章标签：数据库 nosql cassandra

本文链接：https://blog.csdn.net/zwq00451/article/details/109416001

版权

cassandra 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

随着业务发展，经常会遇到cassandra集群的扩容及缩容维护，cassandra提供了非常强大的功能，不停机不影响业务的情况下实现集群的阔缩容能力，具体操作如下：

扩容

步骤如下：

 	1、 准备一个新节点：见《cassandra集群安装》
 	2、 关闭所有节点压缩(可选)
 	       nodetool disableautocompaction
 	       nodetool stop COMPACTION
              迁移完毕之后，再放开压缩功能
           nodetool enableautocompaction
           注：根据我们的经验，以上关闭压缩的步骤多余，反而会因为未及时压缩产生大量SSTABLE而影响性能。
             
    3、 评估扩容时间：
         	生产数据扩容，一般都是T级别的数据迁移，耗时数小时，一般都需要选择晚上或周末，具体视迁移的数据量多少、CPU性能等决定。 若数据量少或机器性能强劲，基本任何时候都可扩容，否则选择晚上或周末。
 	4、 限制集群所有节点数据迁移流量
 	     	nodetool setstreamthroughput 32 (注：32Mb/s = 4MB/s)
 	      	nodetool getstreamthroughput 
          一般，若集群性能好，出流可以设置为8MB/s, 入流可设置70MB/s,  生产迁移过程中可从小到大调整，观察对性能是否有影响，没影响就适当调大。
    5、session超时设置（若已设置，忽略此步）
          	根据同步数据量计算需要大概多少时间能迁移完成。
          	如：60G,传输速率4MB/s，大约需要4.26小时完成。
          	配置:cassandra.ymal
          	streaming_socket_timeout_in_ms值，默认3600000（1H，生产环境明显不够），改成172800000（48H），保证有足够时间完成数据迁移
    6、数据迁移完成后清理数据
        	 nodetool cleanup
        	 节点一个个的清理，一个完成后再清理下一个。
         注：清理数据会大量消耗集群性能，对twcs，不必删除，经过一段时间后冗余数据会自动清理；
    7、监控迁移情况
          nodetool netstats   数据迁移情况
          nodetool compactionstats -H   SSTABLE压缩情况
          nodetool status      集群情况，UJ：未完成，UN：已完成
    8、遇到的问题（物化视图慎用，否则无法扩容）
    	  报表使用物化视图，物化视图迁移数据使用的批量提交Batchlog,引起内存溢出。
    	  新增节点一两分钟内既会报错：
    	  java.lang.IllegalArgumentException:Mutation of 34.309MiB is too large for the maximum size of 16.000MiB
    	  限流之后，上面异常会消失，随后会出现内存溢出报错
    	  java.lang.OutOfMemoryError:Java heap space
          最后我们把物化视图功能取消，数据迁移一切正常。

正常缩容

步骤如下：

    1、选择一个要下线的节点实例
    2、选择下线时间，见扩容。
    3、限制集群所有节点数据迁移流量
          	nodetool setstreamthroughput 32 (注：32Mb/s = 4MB/s)
 	      	nodetool getstreamthroughput 
 	      	一般，若集群性能好，出流可以设置为70MB/s, 入流可设置8MB/s,  生产迁移过程中可从小到大调整，观察对性能是否有影响，没影响就适当调大。
 	4、执行下线命令
 			nodetool decommission
    5、监控迁移情况
          	nodetool netstats   数据迁移情况
          	nodetool compactionstats -H   SSTABLE压缩情况
          	nodetool status    删除节点状态为UL

强制删除节点

强制删除节点一般用在节点宕机的情况下使用

nodetool removenode hostid    (force)

如：nodetool removenode 8b6dbd89-a4ed-479c-9fc2-9f92712bf48a  force;

zwq00451

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
五、CASSANDRA集群节点缩扩容

随着业务发展，经常会遇到cassandra集群的扩容及缩容维护，cassandra提供了非常强大的功能，不停机不影响业务的情况下实现集群的阔缩容能力，具体操作如下：扩容步骤如下： 1、准备一个新节点：见《cassandra集群安装》 2、关闭所有节点压缩(可选) nodetool disableautocompaction nodetool stop COMPACTION 迁移完毕之后，再放开压缩功能 no
复制链接

扫一扫

专栏目录