Cassandra 3.x官方文档_cassandra.yaml配置文件

最新推荐文章于 2024-03-11 10:27:35 发布

嫩草终结者

最新推荐文章于 2024-03-11 10:27:35 发布

阅读量1.3w

点赞数

分类专栏：数据库 Cassandra基础

数据库同时被 2 个专栏收录

59 篇文章 1 订阅

订阅专栏

Cassandra基础

14 篇文章 3 订阅

订阅专栏

cassandra.yaml是Cassandra的主要配置文件

重要: 修改完cassandra.yaml文件配置以后，你必须重启节点使他生效。它位于下面的目录中：

• Cassandra package 安装: /etc/cassandra

• Cassandra tarball 安装: install_location/conf

配置属性分为以下几个部分：

•快速开始

配置集群所需的最小属性

• 常用的

配置Cassandra时最常用的属性

•性能调优

性能调优以及系统资源调用，包括commit log，compaction，内存，硬盘I/O，CPU，读和写。

•高级的

高级用户或者不常用的属性的属性配置

•安全

服务器和客户端安全设置。

注：带注释的值表示内部定义，缺少，注释或者实现取决于cassandra.yaml文件里的其他属性。此外，一些注释的值并不符合实际默认值，这些值仅推荐于默认值改变时。

快速开始配置属性

配置集群所需的最小属性

相关信息：在111页的初始化一个多节点集群(单数据中心)和在114页的初始化一个多节点集群(多数据中心)。

cluster_name

(默认: Test Cluster) 集群名称。这个设置防止一个逻辑集群的节点加入另外一个集群。一个集群中所有节点必须使用相同的名称。

listen_address

(默认: localhost) Cassandra绑定的，用来连接其他Cassandra节点的IP地址或者主机名称。设置这个参数或者listen_interface，不需要同时。当在多节点间通信时，必须修改默认配置：

• 一般设置为空。如果节点是正确设置的(主机名称，名称解析等)，Cassandra通过InetAddress.getLocalHost()可以从系统获取本地地址

• 如果是单节点集群，你可以使用默认配置(localhost)

•如果Cassandra找不到正确的地址，你可以指定IP地址或者主机名称。

•永远不要指定0.0.0.0，总是错的。

• 如果你使用多个物理网络接口，把listen_address和listen_on_broadcast_address设为true

listen_interface

(默认: eth0)注Cassandra绑定的接口，用于连接其他Cassandra节点。接口必须对应一个地址，不支持IP别名。参考listen_address。

listen_interface_prefer_ipv6

(默认: false) 默认情况下，如果一个接口有一个ipv4和ipv6的地址，第一个被使用的是ipv4地址。如果该选项设置为true，第一个被使用的就是ipv6地址。

如果安装过程中修改了任何默认的目录，请确保你有root权限来设置这些属性。

commitlog_directory

这个目录是commit log 存放的地方：

为了获得最佳的写入性能，将commit log放在单独的磁盘分区，或者(理想情况下)和data文件目录分开的物理设备上。由于commit log只能追加的，因此HDD已经可以达到这个目的了。

data_file_directories
这个目录位置就是表数据存储的地方(在SSTables里)。Cassandra将数据均匀的分布在这个位置，受配置的压缩策略粒度的限制。

作为生产的最佳实践，使用RAID 0 and SSDs

saved_caches_directory
这个目录是table key和row缓存存放的地方。默认位置：
• Package 安装: /var/lib/cassandra/saved_caches
• Tarball 安装: install_location/data/saved_caches

常用的属性
配置Cassandra最常用的的属性。

第一次启动节点之前，你应该仔细评估你的要求。

常见的初始化属性

注:请务必在快速启动选项中设置好属性。

commit_failure_policy

(默认: stop)提交磁盘故障策略：

• die

关闭gossip和Thrift，然后杀掉JVM进程，这样节点就可以被替换。

• stop

关闭gossip和Thrift，使节点实际上死亡了，但是可以使用JMX检查。

• stop_commit

关闭commit log，让写聚集，但继续提供读服务(就像Cassandra 2.0.5之前的版本)。

• ignore

忽略致命错误，并让批失败。

disk_optimization_strategy

(默认: ssd)优化磁盘读取策略可以设置成固态硬盘或者旋转的。

disk_failure_policy

(默认: stop)设置Cassandra如何响应磁盘故障。建议设置成stop或者best_effort。

• die

关闭gossip和Thrift，然后对于任何系统错误或者仅仅是SSTable错误，都杀掉JVM进程，这样节点就可以被替换。

• stop_paranoid

关闭gossip和Thrift，即使仅仅是SSTable错误。

• stop

关闭gossip和Thrift，让节点实际上死亡了，但是可以使用JVX检查。

• best_effort

停止使用故障磁盘，然后基于剩余可用的SSTables来响应请求。这意味着你会在一致性级别为1的基础上看到过时的数据。

• ignore

忽略致命错误，并允许请求失败；所有文件系统错误都会被记录，但是忽略。在Cassandra 1.2版本之前是这种情况。

相关信息：在133页，在Cassandra 1.2处理磁盘故障博客和使用JBOD从单磁盘故障恢复。

endpoint_snitch

(默认: org.apache.cassandra.locator.SimpleSnitch) 设置成一个实现IEndpointSnitch接口的类。Cassandra使用告密者来定位节点和路由请求。

• SimpleSnitch

用于单数据中心部署或者公共云中的单个区域。不识别数据中心或者机架信息。它视策略顺序为接近，当忽略读修复时可以提高缓存局部性。

•GossipingPropertyFileSnitch

建议生产使用。本地节点机架和数据中心定义在cassandra-rackdc.properties文件里，通过八卦协议传播到其他节点。为了便于从PropertyFileSnitch移植，它也使用cassandra-topology.properties，如果存在的话。

• PropertyFileSnitch

决定于机架和数据中心的距离，这是明确的在cassandratopology.properties文件里配置的。

• Ec2Snitch

EC2部署在一个单一区域。从亚马逊的EC2 API加载区域和可用区域信息。该区域被视为数据中心和作为机架可用区域，而且使用私有IP。它不跨多个区域工作。

• Ec2MultiRegionSnitch

使用共有IP作为broadcast_address，以此来允许跨区域连通。这意味着你也必须把种子节点地址设置为共有IP，而且开放公共IP防火墙的storage_port端口或者l_storage_port端口。对于区域内通信，Cassandra在连接建立之后切换到私有IP。

• RackInferringSnitch:

Proximity由机架和数据中心决定的，假定符合每个节点IP地址的第三个和第二个字节。使用这个告密者最好的例子是写一个定制的告密者类(除非这恰好符合你的部署)

• GoogleCloudSnitch:

在跨一个或者多个区域的Google云平台上部署Cassandra时，使用GoogleCloudSnitch。这个区域被视为一个数据中心和被视为数据中心内机架的可用区域。所有通信发生在相同逻辑网络内的私有IP地址。

• CloudstackSnitch

在Apache Cloudstack环境中使用CloudstackSnitch

相关信息：设置缓存容量

row_cache_class_name

(默认: 禁用 - row 缓存不可用)note指定要使用的行缓存提供程序，OHCProvider还是SerializingCacheProvider。OHCProvider是完全堆外内存的，SerializingCacheProvider是部分堆外内存的。

row_cache_keys_to_save

(默认: 禁用 – 所有的key都被保存)注从row缓存中保存的key的数量。

row_cache_size_in_mb

(默认: 0- 禁用)行缓存在内存中的最大大小。行缓存可以存储超过key_cache_size_in_mb，但是空间密集，因为它包含了整行。仅仅在热点行或者静态行使用行缓存。如果你减少的太小，你可能在启动的时候得不到最热点的key。

row_cache_save_period

(默认: 0- 禁用) Row保存在缓存中的秒数持续时间。缓存保存在saved_caches_directory。该设置有row_cache_size_in_mb描述的限制。

memory_allocator

(默认: NativeAllocator)

堆外内存分配器。除了缓存外，该属性还会影响存储引擎元数据。支持的值：

• NativeAllocator

• JEMallocAllocator

实验表明，jemalloc相比较native分配器而言更节省内存，因为它更能防止碎片化。使用、安装jemalloc作为库和修改cassandra-env.sh。

注意: JEMalloc3.6.0和以后的版本应该在选项中使用。已知错误发生在较早版本中。

计数器缓存属性

计数器缓存有助于减少计数器锁对于热点计数单元格的竞争。如果RF = 1，计数器缓存命中会导致Cassandra在完全写之前跳过读。RF > 1计数器缓存命中将有助于减少锁的持续时间，帮助热点计算器单元格更新，但是不允许跳过完全读。只有计数器的本地（时钟，计数）元组存储在内存中，而不是整个计数器，所以它相对便宜.。

Note: 减小计数器缓存的值的大小，可能导致不能在启动时获取最热点的key。

counter_cache_size_in_mb

(默认值: empty)注当没有指定值时，最小是堆内存的2.5%或者50MB。如果你执行计数器删除而且依赖gc_grace_seconds，你应该禁用计数器缓存。想禁用它，设置成0.

counter_cache_save_period

(默认: 7200 秒 [2 小时]) Cassandra应该存储计数器缓存的时间。缓存被保存在saved_caches_directory。

counter_cache_keys_to_save

(默认值: disabled)注从计数器缓存保存的key的数量。如果禁用，所有的key都会被保存。

墓碑的设置

当执行一个扫描，在一个分区内或跨分区，墓碑必须保存在内存中这样允许把他们返回给协调者。

协调者使用它们确保其他副本知道已删除的行。生成很多个墓碑的工作负载，可能会导致性能问题，然后耗尽服务器的堆内存。参考Cassandra反模式: 队列和类似队列的数据集。只有当你理解了它带来的影响而且要扫描更多的墓碑，你才能去调整这些阈值。此外，你可以使用

StorageServiceMBean来在运行的时候调整这些阈值。

相关信息: Cassandra反模式: 队列和类似队列的数据集

tombstone_warn_threshold

(默认: 1000)警告前一个查询可以扫描的最大墓碑数量。

tombstone_failure_threshold

(默认: 100000)终止前一个查询可以扫描的最大墓碑数量。

网络超时设置

range_request_timeout_in_ms

(默认: 10000 毫秒) 协调者等待顺序扫描或者索引扫描完成的时间

read_request_timeout_in_ms

(默认: 5000 毫秒)协调者等待读操作完成的时间

counter_write_request_timeout_in_ms

(默认: 5000 毫秒) 协调者等待计数器写完成的时间

cas_contention_timeout_in_ms

(默认: 1000 毫秒)协调者继续重试CAS(compare and set)操作的时间。

truncate_request_timeout_in_ms

(默认: 60000 毫秒) 协调者等待清空数据库完成的时间。一个默认很长的时间，可以允许在移除数据之前先做快照。如果auto_snapshot是禁用的(不推荐)，你可以减小这个时间。

write_request_timeout_in_ms

(默认: 2000 毫秒) 协调者等待写操作完成的时间。

相关信息：见135页，Hinted Handoff: repair during write path

request_timeout_in_ms

(默认: 10000 毫秒) 其他操作的默认时间。

相关信息，见135页，Hinted Handoff: repair during write path

节点间的设置

cross_node_timeout

(默认: false) 启用或者禁用节点间操作超时的信息交换(精确测量请求超时)。如果禁用，Cassandra假定请求立即由协调者转发到副本，意味着在超负荷之下需要额外的时间来处理已经超时的请求。

注意: 在启用该属性之前，确保NTP（网络时间协议）已经安装，而且节点间的时间是同步的。

internode_send_buff_size_in_bytes

(默认: N/A)注设置节点间调用发送套接字缓存大小。

当设置该属性和internode_recv_buff_size_in_bytes的时候，缓存的大小限制为net.core.wmem_max。如果未设置，缓存大小被net.ipv4.tcp_wmem定义。

• /proc/sys/net/core/wmem_max

• /proc/sys/net/core/rmem_max

• /proc/sys/net/ipv4/tcp_wmem

internode_recv_buff_size_in_bytes

(默认: N/A)注设置节点间调用的接收套接字缓存大小。

internode_compression

(默认: all) 控制节点间的通信是否是压缩的，有效值有这些：

• all

所有通信都是压缩的

• dc

数据中心之间的通信时压缩的

• none

不压缩

inter_dc_tcp_nodelay

(默认: false) 启用或禁用数据中心之间通信的tcp_nodelay。当禁用较大的，但是较小的网络数据包被发送。这减少了TCP协议本身的开销。然而，如果跨数据中心响应被阻塞，它会增加延迟。

streaming_socket_timeout_in_ms

(默认: 3600000 - 1 小时)注启用或禁用流操作的socket超时。当流超时，流从当前文件从新开始。避免把改值设置的太低，因为它会导致大量的数据再流。

本地传输(CQL二进制协议)

start_native_transport

(默认: true) 禁用或启用本地传输服务器。使用和rpc_address相同的地址，但是端口和rpc_port不相同。见native_transport_port。

native_transport_port

(默认: 9042)客户端监听CQL本地传输的端口

native_transport_max_threads

(默认: 128)注线程处理请求的最大数量。和rpc_max_threads类似，而且和下面的不同:

•默认是不同的(128与不限制)

•没有相应的native_transport_min_threads.

• 空闲线程在30秒后停止

native_transport_max_frame_size_in_mb

(默认: 256MB) 允许帧的最大大小。帧(请求)大于此的会被当成无效而被拒绝。

native_transport_max_concurrent_connections

(默认: -1)指定客户端最大并发连接数。默认的值-1，意思是不限制。

native_transport_max_concurrent_connections_per_ip

(默认: -1)指定每个源IP的客户最大并发连接数。默认的值-1，意思是不限制。

RPC (远程过程调用)设置

客户端连接的调优和配置的设置。

broadcast_rpc_address

(默认: unset)注广播到驱动和其他Cassandra节点的RPC地址。不能设置成0.0.0.0。如果为空，就被设置成rpc_address或者rpc_interface的值。如果rpc_address或者 rpc_interfaceis设置成了0.0.0.0，那么该属性必须要设置。

rpc_port

(默认: 9160)客户端连接的Thrift端口。

start_rpc

(默认: true)启动Thrift RPC服务器

rpc_keepalive

(默认: true)在客户端连接启用或者禁用keepalive(RPC或者本地)

rpc_max_threads

(默认: unlimited)注不管RPC服务器(rpc_server_type)的选择是什么，RPC线程池的最大请求决定了多少并发请求是可能的。然而，如果你在使用rpc_server_type的参数同步，它也决定了可连接的客户端数量。对于大量的客户端连接，这可能导致线程堆栈的内存占用过大。强烈推荐在客户端使用连接池。设置线程池的最大大小作为行为不端的客户端的防护。如果达到了最大值，Cassandra阻塞额外的连接，直到其中一个客户端断开连接。

rpc_min_threads

(默认: 16)note设置RPC线程池的最小大小

rpc_recv_buff_size_in_bytes

(默认: N/A)注设置RPC接收socket缓存的大小

rpc_send_buff_size_in_bytes

(默认: N/A)注设置RPC发送socket缓存的大小

rpc_server_type

(默认: sync) Cassandra提供了三种RPC服务器的选择。在Windows上，sync大约比hsha慢30%。在Linux上，sync和hsha性能差不多，但是hsha使用内存更少。

• sync: (默认每个Thrift连接一个线程)

对于一个大数量的客户端，内存是限制因素。在64位JVM上，180KB是每个线程最小的栈大小，对应于你使用的虚拟内存。物理内存的限制，决定于使用的栈空间。

• hsha:

半同步，半异步。所有的Thrift客户端是异步处理的，使用少量的线程，而且不会随客户端数量而改变，从而可以很好的扩展到多客户端。RPC请求是同步的(每个主动请求一个线程)

注: 当选择此项时，你必须改变rpc_max_threads的默认值(不限制)

•你自己的RPC服务器

你必须提供一个完全限定的o.a.c.t.TServerFactory类名，可以创建服务器实例。

高级故障检测设置

处理性能不佳或者故障组件的设置

gc_warn_threshold_in_ms

(默认: 1000) 任何GC暂停时间长于此间隔的，都记录在WARN级别。(默认的，Cassandra把任何GC暂停时间长于200ms的，都记录在INFO级别)

更多信息:见105页的Configuring logging

dynamic_snitch_badness_threshold

(默认: 0.1) 设置性能阈值，用于动态的将用户请求从性能不好的节点转移。具体来说，他控制表现不佳的节点到底有多糟，在动态告密者更喜欢其他副本之前。值为0.2意味着，Cassandra继续偏爱动态告密者直到节点响应时间比表现最好的节点要差20%。直到达到阈值，传入的请求被动态的路由到最近的副本(由告密者决定的)。如果这个参数的值比0大，而且read_repair_chance比1.0小，缓存的容量在节点上最大化。

dynamic_snitch_reset_interval_in_ms

(默认: 600000 毫秒)重置所有节点分数的时间间隔，允许坏节点恢复

dynamic_snitch_update_interval_in_ms

(默认: 100 毫秒)告密者计算节点分数频率的时间间隔。因为计算分数是CPU密集型的，因此当较少该间隔时要小心。

hints_flush_period_in_ms

(默认: 10000)设置hints从内部缓存刷新到磁盘的频率。

hints_directory

(默认: $CASSANDRA_HOME/data/hints)设置hints的存储位置

hinted_handoff_enabled

(默认: true) 启用或禁用hinted handoff。想每个数据中心都启用，添加数据中心列表。举个例子：hinted_handoff_enabled: DC1,DC2。一个hint表明写需要重播到不可用的节点。Cassandra把hint写入到协调者的一个hint文件里。

相关信息：见135页，Hinted Handoff:在写路径修复

hinted_handoff_disabled_datacenters

(默认: none) 指定不会执行hinted handoffs的数据中心黑名单。想要每个数据中心启用，需要添加到数据中心列表。例如，hinted_handoff_disabled_datacenters:- DC1 - DC2.

相关信息：见135页，Hinted Handoff:在写路径修复

hinted_handoff_throttle_in_kb

(默认: 1024)每秒每个传输线程最大的阈值(kb)。此速率按比例减少了集群中节点的数量。例如，如果集群中有两个节点，每个交付线程将使用最大速率。如果有三个，每个节点将节流最大值的一半，因为两个预计同时传输hints。

max_hint_window_in_ms

(默认: 10800000 毫秒 [3 小时])为一个未响应的节点生成hints的最大时间。超过了这个时间间隔，新hints不会再生成，直到节点回来而且响应了。如果节点再次下线，一个新的间隔开始了。该设置可防止一个节点重新上线对于资源的突然请求，而且集群剩下的节点尝试重播大量的hinted写。

相关信息：见14页，故障检测和恢复

max_hints_delivery_threads

(默认: 2)传递hints的线程数量。在多数据中心部署中，考虑增加这个数量，因为跨数据中心的handoff一般都比较慢。

max_hints_file_size_in_mb

(默认: 128)单个hints文件的最大大小，单位MB。

hints_compression

(默认: LZ4Compressor) Hints文件压缩器。支持的压缩器有：LZ, Snappy, 和Deflate。如果你不指定一个压缩器，hints文件就不会被压缩。

batchlog_replay_throttle_in_kb

(默认: 1024KB 每秒)

总的最大阀门。阀门随着集群的节点数量的减少。

请求调度属性

根据定义好的策略来处理传入的客户端请求的设置。如果你需要使用这些属性，你的节点过载而且丢弃请求。建议你添加更多的节点，而不是尝试优先级的请求。

注:该选项的属性仅应用于Thrift的传输。他们在本地协议使用CQL协议没有影响。

request_scheduler

(默认: org.apache.cassandra.scheduler.NoScheduler)根据定义好的策略定义一个调度来处理传入的客户端请求。这个调度对于包含多个keyspaces的单个集群的客户端请求的节流是有作用的。该参数尤其对于客户端请求很好，而且不会影响节点间通信。有效的值如下：

• org.apache.cassandra.scheduler.NoScheduler

没有调度发生

• org.apache.cassandra.scheduler.RoundRobinScheduler

对于一个节点的一系列的客户端请求，为每一个equest_scheduler_id使用一个单独的队列。

•一个实现了RequestScheduler接口的Java类

request_scheduler_id

(默认: keyspace)注执行请求调度的标识符。当前唯一有效的值是keyspace。见weights。

request_scheduler_options

(默认: disabled)包含了一个属性列表，定义了request_scheduler的配置选项。

• throttle_limit: Thenumber of in-flight requests per client. Requests beyond this limit are queuedup until running requests complete. Recommended value is ((concurrent_reads+concurrent_writes)× 2).

每个客户端的in-flight数量。请求超过这个限制的会进入到队列中，直到运行中的请求完成。推荐的值是((并发读数量 + 并发写数量) × 2).

• default_weight: (默认: 1)注

每个回合中循环处理有多少请求。

• weights: (默认: Keyspace: 1)

它设置每个回合中循环处理有多少请求，基于request_scheduler_id.

Thrift 接口属性

旧的客户端遗留的API。CQL是一个类似的而且对Cassandra来说更好的API。

thrift_framed_transport_size_in_mb

(默认: 15)给Thrift的帧的大小(最大字段长度)。帧是应用程序插入的行或者行的一部分。

thrift_max_message_length_in_mb

(默认: 16)Thrift消息的最大长度(MB)，包括所有的字段。Thrift开销(每一帧开销1字节)。消息的长度一般和批处理结合起来使用。一帧的长度大于或等于24，容纳了四个插入的批处理，每一个是24字节。要求的消息的长度大于或等于24+24+24+24+4(帧的数量)