在父进程通过system()函数创建或fork创建子进程时,子进程会继承父进程的资源,包括文件设备访问权限、文件描述符等。这些资源在父子进程交互或共享提供便利的同时也带来了一些弊端,fork会导致 file->count++, 在父进程 close的这些文件设备时候发现还是别的地方对这些文件设备使用,就不会release,导致父进程重新open的时候就会出现"Cannot open '/dev/xxx': 1, Operation not permitted"等异常问题。
解决这种由于子进程资源继承的问题,把与父进程无关联的进程尽量不要通过父进程创建,而通过启动脚本创建,公共进程间的通信方式进行数据交换和控制。
但在应用层面上,有时候很难去更改第三方已经固化好的启动脚本。不得不通过代码system()函数创建或fork创建子进程。解决这个问题,在子进程启动前后启动后第一件事情就是关闭这些子进程继承过来的文件设备。
int my_system(const char * cmdstring)
{
pid_t pid;
int status = 0;
if(cmdstring == NULL)
{
return (1);
}
if((pid = fork())<0)
{
status = -1;
}
else if(pid == 0){
//close father dev or file handle
close_all_fd();
execl("/bin/sh", "sh", "-c", cmdstring, (char *)0);
-exit(127); //子进程正常执行则不会执行此语句
}
else{
while(waitpid(pid, &status, 0) < 0){
if(errno != EINTER){
status = -1;
break;
}
}
}
return status;
}
这种方法会把父进程正在使用的文件设备关闭,影响到父进程的功能,所以应该把close_all_fd()放到进程体去执行;
关于 close_all_fd APUE上给的做法是:
int close_all_fd(void)
{
struct rlimit lim;
unsigned int i;
if (getrlimit(RLIMIT_NOFILE, &lim) < 0)
return -1;
if (lim.rlim_cur == RLIM_INFINITY)
lim.rlim_cur = 1024;
for (i = 0; i < lim.rlim_cur; i ++) {
#ifdef MYPERF
if (i == 1)
continue;
#endif
if (close(i) < 0 && errno != EBADF)
return -1;
}
return 0;
}
int close_all_fd(void)
/proc/父进程id/fd
{
DIR *dir;
struct dirent *entry, _entry;
int retval, rewind, fd;
dir = opendir("");
if (dir == NULL)
return -1;
rewind = 0;
while (1) {
retval = readdir_r(dir, &_entry, &entry);
if (retval != 0) {
errno = -retval;
retval = -1;
break;
}
if (entry == NULL) {
if (!rewind)
break;
rewinddir(dir);
rewind = 0;
continue;
}
if (entry->d_name[0] == '.')
continue;
//遍历的时候分析下描述符对应的软连接是不是指向一个socket,以免错杀无辜的描述符
{
char link_name[1024] = 0;
int ret_link = 0;
ret_link = readlink(entry->d_name,link_name ,1024);
if((ret_link == 0) && (strcmp(link_name,"socket:") == 0))
{
comtinue;
}
} fd = atoi(entry->d_name);
if (dirfd(dir) == fd)
continue;
if (fd < 3) /***jump root dev**/
continue;
retval = close(fd);
if (retval != 0)
break;
rewind = 1;
}
closedir(dir);
return retval;
}