系统运维
kevin_水滴石穿
平心静气,日积月累,厚积薄发
展开
-
旁观一个软件产品的终结
一个多月前,企业微信群里,突然发出xx系统的服务器将于xx时刻正式关闭,宣告着一个运行了10多年的软件系统的生命终结。群里一片致敬xx系统的信息,刷屏了。思维一下子回到了大概9年前,记得我刚入职公司时,该系统就已经运行了几年了,弹指一算,该系统已经运行了10多年了,差不多也该终结了。作为一个全集团都曾经使用的业务系统,能够到今天寿终正寝也是体现了该软件的顽强生命力。替代它的OA系统已经上线运行了2年有余了,功能也更加强大了。 在大概6年前这个系统还进行过一轮大的升级,当...原创 2021-05-23 11:13:33 · 190 阅读 · 0 评论 -
服务器的寿命到底有多长
我们现在生产系统的主数据库的服务器在2016年购入,到现在已经快5年了,今年春节以前几乎没有出现过任何硬件的故障。过完春节后,到了3月后,某一天系统突然无故挂了,自动重启也没有能够启动,于是强行手动重启。 本次故障后大约3周,主服务器进入了故障模式中,经常意外重启,而且自动重启往往无法生效,也就是在重启过程中突然就卡死了,只能后台强制重启,有时候远程无法强制重启,还得现场去强制断电重启,这就尴尬了。找供应商的人来检测过,也更换过一次故障内存,但是这种情况频繁出现,生产系统经不起这...原创 2021-05-23 10:29:18 · 5484 阅读 · 0 评论 -
内存更换乌龙事件
在上次服务器部分内存损坏后,我们拆下了部分损坏的内存,现在又约好了时间更换内存。Infra的同事在和供应商反复沟通过后,确认了服务器的型号,内存的型号及更换的时间,我们也发布了停机通知。一切准备就绪了,大家就等着供应商的同事过来撸起袖子开干了,然后启动服务器,系统正常运行。 这只是想象中的剧本,有可能供应商的同事太忙了,或者是其他啥原因,他们到达现成后发现本来应该过来换DDR3的内存的,现在手里带过来的全是DDR4的内存,于是我们又让他们紧急派人送货过来,毕竟我们的停机时间也只有...原创 2021-05-23 10:10:05 · 100 阅读 · 0 评论 -
服务器故障之内存损坏
前段时间机房各种故障不断,终于消停了一周了,没有想到一周后又出现了一列。这次只是我们系统的故障,我们查看了服务器后定位到数据库服务器一些异常反应,但是从服务器的表现来看却又无法断定就是硬件故障,尴尬之余,我们找来infra的同事一起查看,他们刚开始很自信的告诉我们硬件都是正常的,虽然我们看到内存都是正常的现实,但是系统的一系列不正常反应,让我们觉得这个数据库的服务器肯定存在问题,经过一个小时的论证,我们终于收到了Infra的反馈,他们收到了硬件错误的提示,只是信息有点延迟,现...原创 2021-05-23 09:58:57 · 1337 阅读 · 0 评论 -
交换机故障引发的血案
经历了上次的网络故障后,infra的同事加强了对机房的设备的巡检,同时也对可能出现问题的设备做了更换。只是没有想到,这些设备故障好像具有了传染性似的。在网络故障不久,又出现一次机房的全网故障,这次是生产和测试环境都没有办法使用了,更狠了。 同样的故事上演,infra的2位同事马不停蹄的赶往现场,经过一番检查,确认就是主交换机故障了,这下就郁闷了,因为这个交换机刚换了不久,这种事又遇上了,情急之下,只好找了另外一台交换机先暂时顶着了。这机房难道有毒,设备进来都会染病罢工。经过2...原创 2021-05-23 09:44:38 · 178 阅读 · 0 评论 -
一根网线引发的血案
在一个阳光明媚的早上,我在来公司的路上就收到了企业微信里的消息,生产系统都挂了。我们赶快相互做了确认,昨天晚上好像所有挂掉的系统都没有做发布。于是我们赶快给infra的同事反馈,Infra的同事表示自己也远程登录不上服务器了,现在正在安排同事赶往机房。现在上班时间到机房的路上比较拥堵,大概需要1个小时左右,剩下的就是漫长的等待了。 大约一个小时候,infra的同事到了机房,发现服务器的硬件都是正常,交换机也正常,进行了各种排查后才发现是否那根网线出了问题,经过一番定位,确定主交换机上的一根...原创 2021-05-23 09:28:38 · 115 阅读 · 0 评论 -
IT囧事之误删测试环境的生产库
前段时间我身边就发生一桩离奇的删库事件,测试环境的一台服务器磁盘马上就满了,配置管理的同事登录上去看了后发现,这台服务器上部署了一些无关紧要的测试数据库,想着这台服务器一直没有什么人使用,也就没有必要增加空间了,干脆删除掉一个测试库得了。于是就随手删除了一个测试库(写着xxUAT的测试库)。删除前也没有做备份,因为这个项目在印象中已经停了。刚好那天是周5,数据库删除后也没有人反馈什么问题,整个周末也一直很平静。到了下周一,突然有用户反馈有个公众号访问不了了,负责人调查了下,发现数据库被...原创 2021-05-23 08:48:40 · 368 阅读 · 0 评论 -
Visual Studio开发工具升级注意事项
由于前几年公司开发的系统使用的开发工具版本不统一,现在后期维护升级在开发人员的电脑上要同时安装好几个不同的开发工具,比如VS2008,VS2010,VS2012,甚至还有用VS2003开发的接口之类的程序,这种还在目前的win 7系统上无法安装,只好安装在虚拟机上了。这样导致开发人员的电脑安装的软件过于庞大,C盘即时有100G的空间,也会被占用的所剩无几。电脑运行的速度也是大大下降,严原创 2014-06-23 21:25:13 · 1004 阅读 · 0 评论 -
应用程序默认安装在C盘后启动时提示权限不足想起的。。。
最近不少经销商用户反映,在使用win 7的系统的电脑上安装我们的软件后,开启系统时提示权限不足,无法启动软件。而在xp系统下则没有这个问题,原因在于我们将系统的默认安装路径选择在了C盘了,而win 7系统在安装软件时,有些时候没有管理员权限时可能会提示权限不足,或者在安装软件时,用户只是选择了只是让当前用户可以使用该软件,这样其他用户登录时则无法使用软件了。 考虑到用原创 2014-06-23 21:47:47 · 5225 阅读 · 0 评论 -
IT系统故障引起的一个事故的思考
IT系统故障原创 2014-05-02 13:29:47 · 2589 阅读 · 0 评论