昨天晚上外网运行了上线通知有问题,又出现了上次的问题,运行一段时间之后程序慢慢退出。。
查了好久,终于找到原因,特此写下,作为一个总结。
编译错误已经排除,g++ -Wall能排除大部分的错误
按照一般的思路,1.程序出错退出,都会产生core文件,分析core文件就能查找到哪里出错了,但是由于我的程序是继承公司的父类,产生多个子进程,公司的策略是一个子进程异常死亡会被捕获,然后自动拉起一个新子进程,不会产生core文件,所以比较郁闷,怀疑是内存出错,2.运行valgrind分析,没有查到错误,但是问题依旧存在。。
3.写日志,写日志只能察看逻辑方面的,因为是多进程,日志比较乱,很难分清是哪里的日志,到底哪里死掉了很难看出来
4.查看代码也找不到是啥原因,最后实在没办法了,5.在主要程序部分添加try{} catch(...){},自己捕获所有异常,终于发现问题出在哪个函数了,然后在该函数部分添加日志,打印内存信息
最后找到了问题,原来是有一个函数需要一个手机号码作为参数,但是没有检查该手机号是否是错误数据,导致异常。。。
总结:一个函数:要检查正确的输入,要区分各种情况的输出,对于数据一定要判断
///
grep 时偶尔会出现如下错误 Binary file 文件名 matches
grep将文件当作了二进制的了,加参数 -a 强制按照text文件来匹配就ok了。。