AWS EC2上搭建Cassandra集群到底如何呢?

78 篇文章 0 订阅
20 篇文章 0 订阅

 不少浸润在大数据产业中的人,都对数据库有一种天生的“畏惧感”,毕竟,一子错全盘皆落索,并不是完全不会发生的事情。如果整个可用区域(availabilityzone)发生故障,可不是一句负责任便能解决的事情。本文中,大圣众包威客平台(www.dashengzb.cn)将从原理上阐述在AWSEC2上搭建Cassandra集群的可行性,窥探Cassandra承受整个可用区域的故障的极佳性能。

  解惑|能否在AWSEC2上搭建Cassandra集群

  不少浸润在大数据产业中的人都表示疑惑,到底通过AWSEC2多可用区域配置高可用的Cassandra集群,能否实现呢?答案是肯定的。因为,该配置的成本和性能,与单一可用区域的部署几乎完全相同。

  首先,AWS在使用网络性能设置为“High”的实例,并启用增强联网功能的情况下,能够确保可用区域之间保持低延迟。其次,跨越多个可用区域放置节点的好处是,能够提高Cassandra集群的可用性,以及可用区域故障后的弹性。第三,对大部分用例来说,副本因子设置为3,同时使用3个可用区域,都是一种很好的起点。为什么这样说呢,因为这样的配置能够确保Cassandra集群可以实现自包含。第四,虽然可用区域之间的流量并不是免费的,但对大部分用例来说,这并不是太大的问题。在多可用区域内运行无需额外的存储,它的成本的增加幅度是很小的。这样就避免了一部分企业的顾虑。

  优势|Cassandra的高可用性保证了搭建实现的可能

  上文第三点,是Cassandra的一个突出的优点。它提供了一个名为“副本因子(Replicationfactor)”的设置,该设置定义了数据可以存在多少个副本。如果将副本因子设置为1并且一个节点故障了,那么,所有数据都将丢失,因为此时数据只存储在1个位置上。但是,如果将副本因子设置为3,则可以将数据始终保存在3个不同的节点中,那么,就算一个节点故障数据了,也不会受到影响。

  Cassandra是一种很棒的数据库,它的高可用性保证了搭建实现的可能,它不仅可以跨越多个节点自动对数据创建Shard,甚至还可以用近乎线性的方式进行伸缩,因此将节点数量增加一倍即可让容量增加几乎一倍。Stream大幅依赖该技术以确保为上千万最终用户提供信息源(Feed)。

  对于从事数据行业的人士来说,Cassandra的确是一款十分出色的数据库。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值