运维成长全记录
RexKang
认真,执着,努力,不懈,不达目的不罢休;
Python,Nagios,Zabbix,不断地折腾,也曾为了识别验证码去学习神经网络。
思考,学习,冲一杯淡茶,轻轻品味着人生。
展开
-
处理故障的人物速写
@CodeBox-腾讯为大家形象的描绘了一幅故障处理的人物速写:默默解决故障的人站着说话不腰疼的人搅混水逃避责任的人不懂装懂搞无理头的人追究责任的人事后诸葛亮的人最后还有把总结邮件弄成CCTV表彰晚会儿的人呵呵,我再加三个:本来没事被领导叫来打酱油的人可能有事但也是打酱油的人负责事件通报的人好像还有……转载 2013-05-21 08:39:05 · 674 阅读 · 0 评论 -
奇葩的公司,奇葩的现象……
注:以下内容皆为乱侃,不爽的话请勿阅读~奇葩的公司出现奇葩的现象……细致的管理不知道起源于什么事件?自打我来到这个公司的时候,还不是这样。换了几届领导后,现任领导喜欢什么都管,在工作的过程中,领导要求随时汇报工作进展,但频率有些过高了。然后还不断催促。究其根本,是领导不放心,领导为什么不放心呢?因为有些人确实不靠谱,为了确保避免不靠谱的人坏事,所以干脆一棒子打死,对所有人都这样原创 2013-05-22 15:29:02 · 1254 阅读 · 0 评论 -
前期开发工作总结
前期的CMDB第一版本的研发工作可以说是以完全失败告终的,这里总结了10点问题。如何解决?解决的话真心没主意,主要是前7年一直单干,而且转运维开发没多久,东西都是自学的。工具的问题可以搞得定,初步设想有需求到分析到功能到测试用例到任务一系列流转下来,搞一个系统,先用着。顺便出一下相关的数据看看,之前发现Bug率太高了,60~70%。原创 2015-01-11 21:00:32 · 811 阅读 · 0 评论 -
Puppet有条件的执行Exec
notify、subscribe以及refreshonly在多个资源与Exec类型资源依赖时,notify、subscribe以及refreshonly就很常用了。这种情况多见于配置文件更新、防火墙配置调整等等,基本上是配置一类的,像Nagios这类监控系统也是可以这么操作(监控配置调整必须要重启daemon啊,麻烦)。onlyifonlyif只会使Exec在返回0的时候才会执行,原创 2013-08-19 10:05:47 · 1526 阅读 · 1 评论 -
开源堡垒机GateOne的安装、配置笔记
GateOne是一款基于HTML5的开源终端模拟器/SSH客户端,同时内置强大的插件功能。它自带的插件使其成为一款令人惊艳的SSH客户端,但是,它可以用于运行任何终端应用。用户可以将GateOne嵌入其他应用程序从而提供各类终端访问界面,它也支持各类基于Web的管理界面……因为内部临时需要这么一套系统,所以搜搜查查,搞定了系统部署,使用pam认证的配置,做了个简单的管理界面。原创 2014-11-05 11:13:49 · 6546 阅读 · 1 评论 -
FTP同步的另类解决办法——NetDrive
最近某套系统出现故障,具体背景及原因描述如下:背景B系统会定期产生一些报文信息;A系统需要定期获取这些报文;当A系统获得这些报文后,这些报文对B系统就没有意义了,需要清楚;解决方案所以,以前采用这种办法:使用某款经过处理的软件;定时通过FTP抓取这些报文;然后清除远端信息;故障原因软件挂了……原因真EZ是不是?关键是我这个负责监控的没有监原创 2013-06-14 16:22:53 · 5134 阅读 · 0 评论 -
Linux的/etc/services
老忘记,记录一下主要保存的是服务名称、端口号/协议名称、服务别名以及注释信息。原创 2013-08-02 15:44:06 · 1218 阅读 · 0 评论 -
Windows 8的远程管理工具
因为这几天在部署Zabbix,域验证的信息和Apache配置方式不太一样,BindDN的完整信息还没见过,于是就求助于XP(XP为某人)。在XP哪里获取到完整的DN后,成功绑定完成。但是忽然想到以前Windows上面的搜索就能够搜索出这些信息(个人和计算机的搜索选项),在Windows 8里面却怎么找也找不到(还以为是功能来着)。后面才知道要安装一个远程管理工具包,下载后安装,管理工具原创 2013-05-22 09:51:26 · 752 阅读 · 0 评论 -
Puppet的fileserver注意事项
创建很简单,语法类似apache的配置但是名称不能使用modules,真奇怪……[files] path /puppet/var/files allow *[mods] path /puppet/etc/modules allow *原创 2013-08-13 16:35:15 · 952 阅读 · 0 评论 -
关于Git的一些资料
刚刚无聊的时候发现InfoQ上的一些关于Git的文章,顺便总结一下Git的相关资料,回头好好看看。Git历险记系列:Git历险记(一):初识GitGit历险记(二):Git的安装和配置Git历险记(三):创建一个自己的本地仓库Git历险记(四):索引与提交的幕后故事Git历险记(五):Git里的分支&合并GitCommunityBook:alx.github.i原创 2013-08-02 14:00:26 · 877 阅读 · 0 评论 -
wxPython摸索[01]——Python Win32程序的界面设计
最近实在太忙,N多东西都来不及通过文字方式记录下来,今天还有点空,记录一些wxPython的学习内容。实际将要记录的内容不仅仅是wxPython的,还有wxFormBuilder的。废话就不说了,多记录些有用的内容。话说Python下的Win32框架有很多,wxPython算是一个简洁的吧。听说PyQt有很多需要安装的,我的Win8性能利用已经超过100%了,所以,简单些吧。要原创 2013-07-26 18:39:17 · 1870 阅读 · 0 评论 -
Puppet报错Duplicate declaration: Package is already declared in file
呃,又报错了……与软件斗,其乐无穷就是有点浪费时间……Info: Retrieving pluginError: Could not retrieve catalog from remote server: Error 400 on SERVER: Duplicate declaration: Package[make] is already declared in file /etc/pu原创 2013-08-20 16:55:46 · 2779 阅读 · 0 评论 -
Puppet报错Could not match
刚刚报了个错:Error: Could not retrieve catalog from remote server: Error 400 on SERVER: Could not match ; at /etc/puppet/modules/app_dokuwiki/manifests/initial/initial.pp:24 on node zabbixtest.hna.netWar原创 2013-08-20 16:48:21 · 2434 阅读 · 0 评论 -
调整Windows8允许多用户登录
最近LP说要在继续教育平台上学习,好像是中级的需要进行继续教育吧,具体情况不管了。LP说网站登录后没办法听到声音看到视频,但是我的可以,系统环境是Win8,IE10,不过是在Chrome下使用IPA插件的。尝试了一下,LP的环境果然不行,后来干脆不试了,直接Win8+多用户登录,最简单的呃方式。破解termsrv.dll用WinHex打开C:\windows\system32\原创 2013-05-03 17:22:01 · 2629 阅读 · 0 评论 -
监控系统的那些事儿1——部署了开源监控后
本文属于个人的一些零碎的想法的集合,可能有些跳跃,各位看官海涵。某些观点可能不专业,如果你有其他见解不吝提出,共同学习,谢谢!背景由于庞大的HP Openview监控系统一个人实在是没有时间搞,刚好也被交出去了,所以索性搞了一套开源监控。在开源监控的选择上,在测试了将近半年后,决定正式使用Icinga和Cacti。用了很久的Icinga——或者说Nagios的衍生版,也用了Ca原创 2013-05-13 17:11:01 · 1030 阅读 · 0 评论 -
监控系统的那些事儿4——迫不得已上的开源
因为各种原因,重新回到了公司,工作也重新分配了。因此,原有的OVO系统就不归我管了,因为没有足够的资料能说明我的一个配置修改到底会有多大影响。不知道是不是用得久的原因(顺便指管理混乱,系统状态不佳,硬件资源耗尽),设置经常不起作用,也没多少功夫去查。另外,这个系统是个新员工管理的,再加上本来公司就想淘汰它,所以,我也懒得挽救它了。开源,迫不得已话说上开源这个工作实在是迫不得已,原创 2013-05-20 16:50:58 · 884 阅读 · 0 评论 -
监控系统的那些事儿3——到底有什么需求
监控系统的基本需求在监控系统中,我们主要考虑的是:检测是否及时;检测的结果是否返回及时;检测结果是否正确;阈值是否合理;是否及时发出告警;运维人员是否认可这种检测方式;是否可以进行相同的检测;前四点不用说了,主要说一下第5、6、7点。阈值是否合理想起“阈值”这两个字我都有点疯了的感觉,纠正了很多次了,很多人还是说“阀值”。阈值的合理性实际上是对监控系统的一个原创 2013-05-17 14:26:17 · 984 阅读 · 0 评论 -
监控系统的那些事儿2——说说以前用的OpenView
早期的环境早期,公司使用的是HP Openview系列,这个系列下面包含了主机监控(OVO)、网络监控(NNM)、性能(OVPM),网站(OVIS)等一系列的监控软件。如果是网络监控,那么NNM会自动进行轮询并发现思科设备,手动或选中发现的设备,可惜后来我们用华为的了,这一个功能基本上就废了。由于兼职管理,OVO用得多,NNM基本不用,所以后来也就没人会用了——主要是没人没时间,因为兼原创 2013-05-15 08:32:45 · 1600 阅读 · 1 评论 -
Puppet中exec执行批处理时需要注意的问题
如果是直接的命令还好说,如exec { "re2c-install": command => "ntpdate x.x.x.x",}如果是脚本就要注意了,脚本中必须要加入#!/bin/bash否则会报错Error: Could not execute posix command: Exec format error原创 2013-08-14 11:01:51 · 1327 阅读 · 0 评论 -
Puppet报错Failed to realize virtual resources
刚刚学习了虚拟资源,顺便把所有资源虚拟化了……然后报错:Info: Retrieving pluginError: Could not retrieve catalog from remote server: Error 400 on SERVER: Failed to realize virtual resources Package[pkgconfig], Package[php-dev原创 2013-08-20 16:50:43 · 1614 阅读 · 0 评论 -
Puppet的错误Syntax error at ''; expected '' at
这种错误很好修正,明确提示在哪一行了:Error: Could not retrieve catalog from remote server: Error 400 on SERVER: Syntax error at '.'; expected ']' at /etc/puppet/modules/sys_re2c/manifests/install.pp:9 on node zabbixt原创 2013-08-20 16:55:34 · 1880 阅读 · 0 评论 -
OCS Inventory,我又来了
之前见过这款软件应该是前年吧,Martin Liu的博客上看到的,相关的内容很多。话说当时也是因为CMDB不太好用,大家都嚷着要自动化的工具(一群懒人),又不愿意动动手,所以这活最终还是落到我头上来。安装还是相当方便的,但是按照官方的文档貌似安装不上。我记得之前安装花了2个小时,这次花了6个多小时,主要是配置什么的,官方文档讲得太简单,然后普天下文章一大抄,报错信息又不是很明确,基本上原创 2013-07-26 18:50:51 · 2657 阅读 · 0 评论 -
Puppet报错wrong header line format
今天编写msmtp的模块时,突然报了个错:Info: Retrieving pluginError: Could not retrieve catalog from remote server: wrong header line formatWarning: Not using cache on failed catalogError: Could not retrieve catal原创 2013-08-20 16:39:33 · 1254 阅读 · 0 评论 -
wxPython摸索[02]——Toolbar与Tool
在wxPython中,Toolbar很好添加,需要注意的是:和以往的IDE不同,wxFormBuilder的顺序有些乱,添加的Tool的ID在最下面。我当时还纳闷怎么只有个name,修改完之后,在为ToolClicked指定事件处理函数之后,发现点击任意按钮都会执行OnAbout函数。后来找了找,发现ID在最下面,所有的Tool默认ID均为wxID_Any。修改之后,问题解决。原创 2013-07-26 18:29:50 · 1200 阅读 · 0 评论