运维管理
文章平均质量分 83
熊崽Kevin
Imagine the fire, waiting for rises.
展开
-
Google对EB级别数据的备份恢复分享
Raymond Blum领导着一个由网站可靠性工程师所组成的团队负责维护Google神秘的数据资源。尽管Google从来没有透露过这些数据的量到底有多大,不过据消息称,虽然没有达到令人咋舌的YB级别,不过也达到了几个EB。光是GMail的数据就差不多达到了EB级别。这个演讲是关于Google怎么做到EB级别数据的备份及恢复。原创 2014-02-10 16:27:45 · 3681 阅读 · 0 评论 -
MongoDB故障排查记录 [rsHealthPoll] couldn't connect to server
一直在用一个五台机器组成的MongoDB集群(192.168.40.80 ~ 84),5个shard,分了3个分片。之前一直运行正常,最近一段时间发现服务很不稳定,show db老提示说shard 4 error,并且有时候有机器会因为负载过高而宕机。 今日偶然查看MongoDB日志,发现跟shard 4相关的几台机器都在报同样地错误: [rsHealthPoll] couldn't conn原创 2014-03-26 15:06:59 · 3411 阅读 · 0 评论 -
GlusterFS集群自动编译安装配置脚本
工作需要搭建GlusterFS集群,简单写了一个自动化安装配置脚本,只需指出所有节点的ip地址列表以及需要配置的卷信息即可通过一台机器编译、安装、部署整个集群,远程操作通过sshpass完成。原创 2014-04-11 22:03:05 · 2240 阅读 · 0 评论