Cassandra
文章平均质量分 73
Apache Cassandra 是一个高性能、高可用性的分布式数据库,专为处理大量数据跨多个数据中心和云环境的需求而设计。它提供了线性可扩展性和无单点故障的架构,使其成为大数据应用、实时分析和高吞吐量的业务场景的理想选择。Cassandra 采用分布式设计,支持复杂的查询,且易于扩展。
听风∞
初心不变,始终保持钻研精神!
展开
-
优化 Cassandra 性能:定制 Docker 镜像解决 k8s 部署中的配置挑战
在这个方案中,为了调优Cassandra并解决配置未生效的问题,我们采用了通过Kubernetes、ArgoCD以及Bitnami的Helm Chart部署Cassandra的方式。由于直接在Helm Chart中修改Cassandra配置没有生效,我们选择了重新制作Docker镜像的方法来修改配置。通过创建一个新的Dockerfile,我们使用sed命令直接修改了Cassandra的默认配置文件cassandra.yaml,以调整参数原创 2024-01-13 10:58:09 · 675 阅读 · 1 评论 -
Cassandra 批量插入性能探索:从线上问题到优化策略
在这篇技术博客中,我们深入探讨Cassandra数据库中批量插入数据的性能特点。通过详尽的压测分析,我们比较了批量插入不同分区数据与相同分区数据的性能差异,揭示了并发写入设置对TPS和写入延迟的影响。文章还提供了针对Cassandra批量插入性能的优化策略,包括调整concurrent_writes配置和平衡批量大小。无论是Cassandra新手还是资深开发者,本文都将为您提供宝贵的洞察和实用的优化建议。原创 2024-01-09 08:20:53 · 753 阅读 · 1 评论 -
Cassandra 自定义重试策略
在 Apache Cassandra 中,自定义重试策略的主要目的是为了应对各种运行时异常,如读超时、写超时、节点不可用、请求中止和响应错误等。这些异常示例包括 CassandraUncategorizedException 和 WriteTimeoutException。通过实现自定义重试策略,如 DatastaxCustomRetry 类,可以在遇到特定异常时提供更精细的重试逻辑。这个类包含了不同场景下的重试决策,例如读超时、写超时和节点不可用。在 Cassandra 配置类 CassandraConf原创 2024-01-06 12:10:12 · 582 阅读 · 1 评论 -
Cassandra 线上优化实战
只要单个分区数据大小合理,哪怕 2000w 分区也能快速查询查询越大的分区,查询延迟越大一张表中有大分区,但是不查询大分区,查询速度也很快综上设计分区时尽量避免后续产生大分区。原创 2023-11-30 09:56:45 · 1149 阅读 · 0 评论 -
行式存储与列式存储对比
很多同学刚开始学习数据库的时候可能接触到的都是关系型数据库 RDS,它是基于行式存储的思想来进行数据存储的;但是数据库存储领域还有一个不容小觑的力量,非关系型数据库 NoSQL,其中一部分NoSQL 数据库是采用了列式存储的思想,那么我们不禁发问,行式存储和列式存储到底有什么区别?什么样的场景下列式存储类型的数据库更加适用呢?今天我们就来探究一下行式存储和列式存储的区别和联系。原创 2023-12-02 16:50:18 · 968 阅读 · 0 评论