某一台服务器 clickhouse启动时 最大打开文件为1024,导致群里经常报错 errno: 24, strerror: Too many open files
修改 ulimit 值后,需要重启clickhouse服务
命令 | 备注 |
---|---|
sudo supervisorctl restart clickhouse_exporter | 定期抓取ClickHouse(https://clickhouse.yandex/)统计信息,并通过HTTP导出它们,以用于Prometheus |
sudo supervisorctl restart clickhouse-server | clickhouse 服务 |
日志路径
clickhouse-server 日志路径 | /data/log/clickhouse-server/clickhouse-server.log |
clickhouse_exporter日志路径 | 无 |
查看状态命令
sudo supervisorctl status clickhouse_exporter |
sudo supervisorctl status clickhouse-server |
查看clickhouse 最大打开文件数
more /proc/pid/limits |
---|
风险预估
风险项 | |
---|---|
clickhouse_exporter启动失败 | 及时启动服务 对业务无影响;始终无法启动服务,则后续 prometheus监控中无ch00a数据 |
clickhouse-server启动失败 | 节点不可用,需要根据日志进行排查,数据有备份机器,线上服务无影响;无必须回滚操作。 (可先执行停止命令,测试单台服务器失效情况下,集群的状况) |
事后归纳
clickhouse-server 停止后,服务可用性不受影响,关闭时候群内有短暂性报错
supervisorctl 服务也需要关闭,且该服务无优雅关闭的操作(直接kill),关闭时托管的服务也将强制关闭。
/usr/bin/python /usr/local/bin/supervisord -c /etc/supervisor/supervisord.conf |
supervisorctl 重新启动后,相关服务也启动,观察最大文件数 正常。
临时生效:prlimit -n65535 -p pid (推荐使用·)