最近开年就不顺,今天又遇到客户给我说,他们邮箱早上无法发送邮件了。我滴哥啊……远程赶紧拍错吧

看了下HC服务器,有几个服务没有启动,赶紧启动服务,然后一测试,好了。

难倒事情就这么简单解决了?这么简单就不写博客了

由于该客户没有垃圾邮件网关,故想把队列中的垃圾邮件清理下,打开队列查看器,报错,提示查询生成结果太多

1

好吧,我改下,结果还是过多。

p_w_picpath

寻思先来个万能重启大法,重启后情况依旧,而且重启后发现。邮件又不能收发了,好吧,继续排错

先解决收发问题,查看所有服务器服务,正常,查看所有磁盘空间,足够。其余服务器重启了一遍,还是问题依旧,查看日志,没有什么关于收发邮件的问题,看似感觉一切正常。但是就是不能收发邮件。而且在排错过程中,发现每次重启服务,就会有一两封测试邮件发出去了。过会儿又不行。查看了邮件流,没发出去的邮件压根儿连服务器都没到,有的到了服务器但是是显示搁置。思来想去,还是先看看有办法看看删除队列里面的邮件吧,之前我就知道这个客户队列里面的邮件长期都是上万封的。控制台不行,走命令,但是命令也不行。最后查询到,直接删队列文件。

来到HC0的服务器上看了下队列文件

p_w_picpath

9.27G,没看错,9.27G的队列,我辈子见过最大的队列文件,邮件能正常收发我才信了邪。

果断先停止Exchange 传输服务,然后修改Queue文件名,然后再新建一个Queue,启动Exchange传输服务,mailbox服务器上再重启下邮件传递服务(好像是这么个服务,没截图给忘了),再测试收发,秒秒钟邮件就发出去了,多次测试后,依旧是OK的,问题得以解决。瞬间心情就好多了

 

问题排错总结:由于邮件队列巨大,主要是垃圾邮件(之前压力测试过,2W多封的正常邮件队列都没遇到过这样的问题),客户的垃圾邮件一直是1W多封的水平,这次不知道怎么的,9G多的队列,敢说几乎都是垃圾邮件,按一封垃圾邮件100KB来算,都是9W封左右的垃圾邮件在队列里面(处理完后第二天又看了下,队列文件又有2.7G,垃圾邮件数量16W,队列打开多次后才打开看到数量了,昨天9G多的话50W封垃圾邮件是有了),由于垃圾邮件一直没有发送出去,服务器应该对于新的邮件请求几乎就没有接受,导致新的邮件连进入队列的机会都没有,之前排错过程中服务器资源也没有太大异常。总之,如果有遇到同样的问题,特别队列里面都提示看不到结果了,可以试试删除队列文件吧。但是再这个期间的邮件都会丢失,但是这样的结果也用户一直不能收发的好。