cassandra数据备份
作为Instaclustr的首席技术官和联合创始人,Ben为公司确定技术方向,确定新功能。
Ben位于我们的Redwood City办公室,在2015年的Cassandra峰会上,他被公认为Apache CassandraMVP。Ben在社区中活跃,经常在当地聚会上发表演讲,并在相关会议上发表演讲。
自2013年以来, Instaclustr一直为Apache Cassandra提供托管服务。我们的解决方案在AWS,Azure和Softlayer上通过云交付,还通过Heroku作为附加组件交付。 我们还为私有数据中心的客户提供企业管理的功能,并为广泛的客户提供咨询和支持服务。 我们已经看到了各种各样的Cassandra用例在起作用,这篇文章旨在分享我们的一些经验。
Cassandra:基础大数据构建块
显而易见,Instaclustr的我们是Apache Cassandra的忠实拥护者。 我们已经围绕该数据库技术及其强大的功能建立了公司和托管服务。
有很多有据可查的用例,许多令人赞叹的公司都提供了有关如何使用Apache Cassandra的示例,但是作为托管服务,我们可以亲眼目睹这种令人惊叹的技术的强大功能及其对我们多样化的客户群的作用。
可以说,过去几年的经验使我们更加确信Apache Cassandra是下一波全球规模的应用程序和解决方案的基础技术。
我们的用例
当然,我们看到的用例与Planet Cassandra上确定的用例相同,这是我们对每种用例的看法:
- Planet Cassandra的欺诈检测用例在我们的环境中非常活跃。 我们看到,在大多数情况下,该应用程序与通过数据挖掘和深度分析来识别异常以识别与安全相关的事件有关。
- 消息传递。 我们的几个客户拥有与消息传递服务一起使用的社交媒体和数据共享应用程序。
- 物联网。 这可能是我们客户最常用的用例。 使用Cassandra作为物联网解决方案,我们有许多代表广泛行业的客户。 我们还与许多为其自身客户群提供物联网平台的客户合作。
- 目录和播放列表。 在这个特殊用例中,我们没有看到太多其他用例,但是在目录和播放列表中常见的数据模型和使用模式通常只是大型应用程序的一小部分。
- 推荐与个性化。 我们的许多客户都在使用个性化功能。 这在AdTech行业中非常普遍,但是我们的一些客户也在构建针对每个学生的个性化的独特学习平台。
最受欢迎的行业? 我们在AdTech领域拥有庞大的客户群,在这些客户群中,性能和可扩展性的关键指标至关重要。 我们在金融科技行业也拥有核心客户,在这些客户中个性化,高可用性和安全性至关重要。 我们在EdTech领域也有一些客户在开发专门的和个性化的学习平台。
另一个有趣的见解是,我们拥有庞大的客户群,从个人项目到早期的初创企业,一直到拥有140年历史,价值数十亿美元的公司,他们都在寻求转型和增强业务。 我们可以直接看到,您不必是大型公司即可处理大型数据集。
从最初的3节点群集到具有单独的暂存和测试环境的大型生产群集,我们一直与几个原始客户一起工作。
多样的用例帮助我们每天改善
如此Swift而广泛地扩大客户群的好处在于,我们从对这种技术的广泛应用以及特定用例细节的深入了解和理解中受益。 这为我们提供了Apache Cassandra部署的独特视角。 我们看到了它的适应性,但是如果处理不好,我们也会看到它的复杂性和气质。
我们看到与针对所有不同用例的高效生产等级环境和集群相关的特定细微差别。 在我们的照顾下,如此广泛的不同部署使我们自己的数据变得越来越丰富,而现在我们正在通过Instametrics监视环境进行分析。 这有助于我们不断提高能力,并继续使服务产品自动化和完善。
我们还处于与客户一起成长并在某些情况下帮助他们Swift扩展的独特地位。 这也使我们深入了解了在应用程序病毒化或应用程序必须吸收大量数据时如何有效地构建集群或环境。
强大的力量带来巨大的责任
毫无疑问,Apache Cassandra提供了强大的功能,但是要权衡的是,这也带来了一定程度的复杂性。 您不能指望像Apache Cassandra这样的数据库技术可以快速扩展,提供高吞吐量性能并持续运行而无需做任何工作。
持续的监视,维护和性能调整是重要的活动,必须与任何数据库和相关的技术环境一起进行,以使其保持高效运行。 但是,良好的设计和预先计划可能同样重要。
我们经常看到数据层从应用程序开始。 也就是说,许多初创企业首先要花费的时间和精力就是应用程序以及客户在前端构建的东西。 这通常是必要的,以便向投资者展示一个概念或在找到适合市场的需求时快速启动并运行。 这种方法意味着数据通常是事后才想到的。
当考虑到数据后,我们经常会看到应用程序和数据库在开始时就可以正常工作,但是当他们尝试扩展时,Cassandra会使情况变得很糟。 如果您没有以某种机械的同情心对待数据层,并且从一开始就没有有效地计划,那么可能会带来后果。
我们看到,从一开始就对数据体系结构和基础架构进行有效的规划和设计,这意味着我们的客户趋向于繁荣,而扩展和性能并不是问题。 但是,如果您不这样做,而忽略了有效的计划,而忽略了进行持续的维护和调整,那么Apache Cassandra带来的承诺将使您感到无比痛苦。
是的,我们可以根据经验说话。 将您的基础架构和数据库从边缘带回来可能是困难而痛苦的经历。
您最好先进行一些工作。 即使您的环境最初运行良好,但到了必须扩展的时候,您才开始看到问题。
如果您自己设计架构和基础架构,请找一位具有一定经验的独立专家来验证您的工作。 检查并再次检查。 第一次正确执行操作将为您提供有效的扩展能力,高性能和持续的环境,并且当您以错误的方式构建数TB的数据时,可以避免数周的痛苦。 同样,您的应用程序从一开始可能就可以正常工作,但是到了扩展点,我们看到大多数问题都是由客户引起的。
翻译自: https://www.javacodegeeks.com/2016/02/cassandra-foundation-big-data-building-block.html
cassandra数据备份