carbon进程

最新推荐文章于 2021-02-20 09:43:18 发布

D_SJ

最新推荐文章于 2021-02-20 09:43:18 发布

阅读量212

点赞数

原文链接：https://my.oschina.net/u/1263964/blog/706046

版权

2019独角兽企业重金招聘Python工程师标准>>>

Carbon进程

当我们谈起”Carbon”的时候，我们指的是一个或者多个carbon进程，Graphite的存储后端就由这些进程所组成。在最简单的安装场景下，只有一个carbon进程carbon-cache.py。

这份文档对carbon进程提供的功能，以及如何使用这些功能构建出复杂的存储后端进行了简要的概述。

所有的carbon进程都使用同样的协议监听并且接收时间序列数据。但是不同的进程收到这些数据后，会进行一些不同的操作。

Carbon-cache.py

carbon-cache.py接收各种协议的指标数据，并且尽可能高效地把它们写入磁盘。这就要求首先把接收到的指标缓存在RAM里面，然后定期地使用底层的whisper库把RAM里面的指标数据写入磁盘。

运行carbon-cache.py需要一些基本的配置文件：

carbon.conf

配置文件里面的[cache]部分的配置，告诉carbon-cache.py使用什么端口[2003/2004/7002]，什么协议(newline delimited, pickle)以及网络协议（TCP/UFP）来监听。

storage-schema.conf

这个配置文件里面主要使用正则表达式定义了一些指标的收集规则，以及每个.wsp文件存储多长时间的数据。这些规则是给whispter数据库使用的，当.wsp文件创建的时候，会使用到这些规则。

随着数据量的增加，一个carbon-cache.py实例可能满足不了IO负载。为了扩容，可以在一台或者多台机器上运行多个carbon-cache.py实例，carbon-cache.py前面使用carbom-aggregator.py或者carbon-relay.py进行负载均衡。

警告：

如果客户端连接carbon-cache.py的时候，出现连接失败的错误，比如说连接被daemon拒绝，这种错误最常见的原因是文件句柄不够了。

在日志文件里面，如果你发现下面的日志：

Could not accept new connection (EMFILE)

或者是下面的日志：

exceptions.IOError: [Errno 24] Too many open files:

'/var/lib/graphite/whisper/systems/somehost/something.wsp'

这说明carbon-cache.py可以打开的文件数需要增加了。很多系统里面，单个进程可以打开的最大文件数默认为1024，在实际情况下可能需要配置成8129或者更高，这取决于有多少个客户端同时连接到carbon-cache.py的daemon上。

Linux系统上，可以通过sysctl来设置系统全局文件句柄数的最大值，也可以通过ulimit设置。

Carbon-relay.py

carbon-relay有两个不同的功能：集群和分区

当使用RELAY_METHOD = rules模式运行时，carbon-relay.py可以代替carbon-cache.py，然后把所有收到的指标数据转发给多个运行在后端的carbon-cache.py，这些后端的carbon-cache.py可以运行在不同的主机上的不同端口上。

当使用RELAY_METHOD = consistent-hashing模式运行时，需要配置DESTINATIONS，DESTINATIONS定义了基于后端多个carbon-cache.py的分区策略。同样的哈希列表可以通过CARBONLINK_HOSTS 提供给graphite webapp，这样对不同数据的查询就可以被分发到不同的后端carbon-cache上。

carbon-relay使用的配置文件：

carbon.conf

carbon-relay.py使用配置文件里面的[relay]部分的配置，在这里可以配置监听的主机，端口以及RELAY_METHOD。

relay-rules.conf

当使用 RELAY_METHOD = rules 启动carbon-relay.py的时候, 这个配置文件里面的pattern/servers组合定义了匹配相应正则表达式的指标数据应该发给后端的哪个主机。