Unix学习笔记（三）

最新推荐文章于 2023-06-12 11:29:28 发布

彩虹糖梦

最新推荐文章于 2023-06-12 11:29:28 发布

阅读量289

点赞数

分类专栏： C++ Unix 文章标签： Unix

本文链接：https://blog.csdn.net/caozixuan98724/article/details/80289662

版权

Unix 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

C++

3 篇文章 2 订阅

订阅专栏

这一部分的重点在于进程。

1. test.c

源码：

#include <unistd.h>
#include <stdio.h>

int main(){
    printf("%d\n",getpid());
    printf("%d\n",getppid());
}

输出：

这一段代码十分简单，getpid(),getppid()分别获取当前进程和当前进程父进程的进程id。我们关注的是得到的父进程id：11882代表的究竟是什么？

所以我们执行如下命令：

kill -9 11882

得到如下结果：

由此可见，该进程的父进程就是控制台程序。

2. main.c

源码：

#include <errno.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>

int glob = 6;
char buf[] = "a write to stdout\n";

int
main(int argc, char **argv) {
	int var;
	pid_t pid;

	var = 88;
	if (write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1) {
		fprintf(stderr, "%s: write error: %s\n",
				argv[0], strerror(errno));
		exit(1);
	}
	printf("before fork\n");

	if ((pid = fork()) < 0) {
		fprintf(stderr, "%s: fork error: %s\n",
				argv[0], strerror(errno));
		exit(1);
	} else if (pid == 0) { /* child */
                var++;printf("in Child, var is %d\n",var);
                printf("in Child, &var is %p\n",&var);
                char *argv[]={"ls",NULL};
                char *envp[]={NULL};
		execve("../../../../../bin/ls",argv,envp);
		var++;printf("After execve, in Child, var is %d\n",var);
	} else {		/* parent */
		sleep(2);
                printf("in Parent, &var is %p\n",&var);
	}

	printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);
	exit(0);
}

输出：

代码分析：

这一段代码稍微复杂一些，重点在于fork()创建新进程的理解。

要注意的是一下几点：

(1) 从输出结果可以看到，execve后面的语句是没有被执行的，execve之后的语句可以被执行当且仅当exeve语句执行失败的时候。

(2) fork()语句执行之后系统会复制一份一模一样的资源给子进程，所以我们看到在子进程中var的值变为了89而回到父进程var的值依然为88。

(3) 既然资源已经被复制，那为什么在父进程和子进程中var的内存地址是一样的呢？

这说明在unix中，每个进程都有各自独立的内存布局，每一个进程都认为自己占有全部的空间，真实的内存地址需要转化才能得到。

(4) sleep(2)是为了保证先执行完子进程，再执行父进程

3. entry.c

源码：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

int foo(void) {
	printf("Foo for the win!\n");
	return 1;
	/* Note: this will cause a segfault, because this function
	 * returns, but there is nothing to return to: the routines set up
	 * by the kernel remain set up for 'main', we just told the linker
	 * to jump into 'foo' at program start.  Compare objdump(1)
	 * output. */
}

int bar(void) {
	printf("bar rules!\n");
	exit(1);
	/* Unlike foo(), this will not cause a segfault, since we are not
	 * returning; we explicitly call exit(3). */
}

int main(int argc, char **argv) {
	printf("Hooray main!\n");
	/* Note that we do explicitly _not_ return an error here, nor call
	 * any of the exit(3) functions.  Your compiler will warn you
	 * about this. */
}

这个代码本身没有什么好说的，主要是观察代码执行入口的地址，和关于main函数的一些特性。

执行以下命令：

readelf -h a.out

我们可以看到入口地址为0x400470

那么这个地址代表什么呢？

再执行如下命令：

objdump -d a.out|more

可以看到，这段程序的入口为<_start>

注意右侧的 callq 40040<_libc_start_main@plt>我们可以看看这个函数

glibc/csu/lic-start.c

STATIC  int
LIBC_START_MAIN  (int  (*main)  (int,  char  **,  char  **  MAIN_AUXVEC_DECL),
		int  argc,  char  **argv,
		__typeof  (main)  init,
		void  (*fini)  (void),
		void  (*rtld_fini)  (void),  void  *stack_end)
{
[...]
	result  =  main  (argc,  argv,  __environ  MAIN_AUXVEC_PARAM);


	exit  (result);
}

那么，假如我们指定入口函数呢？

输入下面的命令：

gcc -e foo entry.c -o foo

查看输出：

可以看到，程序报错了（段吐核也就是内存错误）

报错原因：从源码中我们看到foo程序return了1，但实际上，在这个程序中没有可以接受这个return值的东西。

同理，如果我们把函数原型改为 int foo(int argc, char**argv)，测试，同样可以发现，这几个参数是访问不到的。

因此我们可以得到如下结论，如果想要指定某一个函数作为程序的入口函数，那么这个函数应该满足如下两个条件

A. 该函数不带参数

B. 该函数不带return值（可以用exit(number)进行替代）

4. exit-handlers.c

#include <stdio.h>
#include <stdlib.h>

int i;

void
my_exit1(void) {
	printf("first exit handler: %d\n", i);
	i++;
}

void my_exit2(void) {
	printf("second exit handler: %d\n", i);
}


int
main(int argc, char **argv) {
	i = 0;
	if (atexit(my_exit2) != 0) {
		perror("can't register my_exit2\n");
		exit(1);
	}

	if (atexit(my_exit1) != 0) {
		perror("can't register my_exit1");
		exit(1);
	}

	if (atexit(my_exit1) != 0) {
		perror("can't register my_exit1");
		exit(1);
	}

	printf("main is done\n");

	return (0);
}

函数输出：

函数详解：

int atexit (void (*)(void))

在讲这个函数之前先提一下进程退出的方式：

进程终⽌的⽅式有8种，前5种为正常终⽌，后三种为异常终⽌：
1 从main函数返回；
2 调⽤exit函数；
3 调⽤_exit或_Exit；
4 最后⼀个线程从启动例程返回；
5 最后⼀个线程调⽤pthread_exit；
6 调⽤abort函数；
7 接到⼀个信号并终⽌；

8 最后⼀个线程对取消请求做出响应。

然后再说一下exit()和_exit()的区别：exit函数运行时首先会执行由atexit()函数登记的函数，然后会做一些自身的清理工作，同时刷新所有输出流、关闭所有打开的流并且关闭通过标准I/O函数tmpfile()创建的临时文件，最后调用_exit系统函数。也就是说exit()函数在退出时会调用一些相关函数做善后处理，而_exit()则是直接退出。

int atexit(void (*func)(void));

用来指定在执行exit()函数时还要执行的函数。

atexit也被称为登记函数，重点我们要观察登记函数的登记顺序和调用顺序，可以看到登记顺序和调用顺序正好相反，这个应该是一个堆栈。