《unix环境高级编程》学习笔记

最新推荐文章于 2024-07-31 17:30:56 发布

海棠花开555

最新推荐文章于 2024-07-31 17:30:56 发布

阅读量152

点赞数

分类专栏：操作系统文章标签： unix环境高级编程

本文链接：https://blog.csdn.net/saber_wtq/article/details/102595342

版权

操作系统专栏收录该内容

7 篇文章 0 订阅

订阅专栏

文件名称	文件描述符
标准输入	0 (默认是键盘)
标准输出	1 (默认是屏幕)
标准错误	2 (默认是屏幕)

每次系统调用都会导致用户模式和内核模式的切换以及执行内核代码，所以减少程序中的系统调用发生的次数可以提高程序的运行效率
程序可以通过缓冲技术来减少系统调用的次数，仅当写缓冲区满或读缓冲区空时才调用内核服务

第3章

以下函数常被称为不带缓冲的I/O（与第五章的标准I/O函数对照），这些不带缓冲的I/O函数不是 ISO C的组成部分，他们是POSIX.1和Single UNIX Specification的组成部分

#include <fcntl.h>

int open(const char *path, int oflag, mode_t mode);

int openat(int fd, const char *path, int oflag, mode_t mode );

函数执行成功返回文件描述符，失败返回-1.

二、相同点

当传给函数的路径名是绝对路径时，二者无区别.（openat()自动忽略第一个参数fd）

三、不同点

当传给函数的是相对路径时，如果openat()函数的第一个参数fd是常量AT_FDCWD时，则其后的第二个参数路径名是以当前工作目录为基址的；否则以fd指定的目录文件描述符为基址。目录文件描述符的取得通常分为两步，先用opendir()函数获得对应的DIR结构的目录指针，再使用int dirfd(DIR*)函数将其转换成目录描述符，此时就可以作为openat()函数的第一个参数使用了。

四、实例

1.打开采用绝对路径表示的文件/home/leon/test.c,如果文件不存在就创建它。

fd = open("/home/leon/test.c", O_RDWR | O_CREAT, 0640);

fd = openat(anything, "/home/leon/test.c", O_RDWR | O_CREAT, 0640);

2.打开采用相对路径表示的文件

a.打开当前目录文件下的test.c

fd = open("./test.c", O_RDWR | O_CREAT, 0640);

fd = openat( AT_FDCWD, O_RDWR | O_CREAT, 0640);

b.打开用户chalion家目录中的test.c文件,且此时你在自己的家目录

DIR* dir_chalion = opendir(/home/chalion);

fd_chalion = dirfd(dir_chalion);

fd = openat(fd_chalion, "test.c" ,O_RDWR | O_CREAT, 0640);

UNIX文件共享

UNIX系统支持在不同的进程间共享打开的文件。内核使用3种数据结构表示打开的文件，它们之间的关系决定了在文件共享方面一个进程对另一个京城可能产生的影响。

(1)每个进程在进程表中都有一个记录项，记录项中包含一张打开文件描述符表，可将其视为一个矢量，每个描述符占用一项。与每个文件描述符关联的是：

a.文件描述符标志

b.指向一个文件表项的指针

(2)内核为多有打开文件维持一张文件表。每个文件表包含：

a.文件状态标志(读、写、添写、同步和非阻塞等)

b.当前文件偏移量

c.指向该文件v节点表项的指针

(3)每个打开的文件或设备都有一个v节点(v-node)结构。v节点包含了文件类型和此文件进行各种操作的函数指针。对于大多数文件，v节点还包含了改文件的i节点(i-node，索引节点)。这些信息是在打开文件时从磁盘上读入内存的，所以，文件的所有相关信息都是随时可用的。例如，i节点包含了文件的所有者、文件长度、指向文件实际数据块在磁盘上所在的位置的指针等。

注意：Linux 没有将相关数据结构分为i节点和节点，而是采用了一个与文件系统相关的 i 节点和一个与文件系统无关的 i 节点。

第四章

实际用户ID，有效用户ID、设置用户ID

下面分别用RUID, EUID,SUID来表示实际用户ID，有效用户ID，设置用户ID。另外用户ID是个整型数，为了说明方便真接使用了用户名来代表不同的UID。先解释一下这几个ID的作用：

RUID, 用于在系统中标识一个用户是谁，当用户使用用户名和密码成功登录后一个UNIX系统后就唯一确定了他的RUID.

EUID, 用于系统决定用户对系统资源的访问权限，通常情况下等于RUID。

SUID，用于对外权限的开放。跟RUID及EUID是用一个用户绑定不同，它是跟文件而不是跟用户绑定。

说明SUID的时候很多书都简略的提了一下passwd这个程序，下面就拿这个例子来分析。我们知道linux系统的密码都存在了/etc/shadow这个文件里。这个文件是如此的重要，在做任何修改之前最好先备份一下。查看/etc/shadow文件的属性如下：

[root@localhost ~]# ll /etc/shadow

-r-------- 1 root root 1144 Jul 20 22:33 /etc/shadow

从上可以看出/etc/shadow文件是一个属于root用户及root组的文件，并且只有EUID为root的用户具有读的权限，其它所有EUID都没有任何权限。当你在steve用户（EUID此时也为steve）的shell下试图用vim打开这个文件时会提示权限不允许。至于连root用户也只有读的权限我猜是为了不鼓励root用户使用vim类的编辑器去直接修改它，而要采用passwd命令来修改这个文件。如果你非要直接修改它，那么你可以使用chmod命令修改为属性为root可写，然后就可以修改了。

用过UNIX系统的人都知道，任何一个用户都可以使用passwd这个命令来得新设定自己的密码。但从上面已经知道，非root用记是无法读这个文件的，那么普通用户是如何做到修改这个文件的呢？我们知道passwd这个命令实际执行的程序是/usr/bin/passwd, 查看这个文件属性如下：

-r-s--x--x 1 root root 21944 Feb 12 2006 /usr/bin/passwd；

对应文件存取标志的s位就是通常说的SUID位，另外可以看到所有用户都有执行的这个程序权力。当steve用户执行passwd命令的时候。Shell会fork出一个子进程，此时进程的EUID还是steve，然后exec程序/usr/bin/passwd。exec会根据/usr/bin/passwd的SUID位会把进程的EUID设成root, 此时这个进程都获得了root权限, 得到了读写/etc/shadow文件的权限, 从而steve用户可完成密码的修改。 exec退出后会恢复steve用户的EUID为steve.这样就不会使steve用户一直拥有root权限。

第8章：进程

0号进程（属于内核进程）是所有进程的祖先，也叫swapper进程。
0号进程创建1号进程（属于内核），1号进程负责内核的部分初始化工作。
然后1号进程通过系统调用execve(),运行可执行程序init，变成用户态1号进程。

什么是僵尸进程：用fork（）创建子进程后，子进程已终止但父进程没有对它进行善后处理，那么子进程的进程描述符就一直保存在内存中，子进程就是僵尸进程。

怎么产生僵尸进程：

1.父进程没有SIGCHLD信号处理函数，也就是没有调用wait()/waitpid()来获取子进程的退出状态，也就没存对进程描述符进行处理。

2.父进程有调用wait()/waitpid()函数，但当子进程已终止时父进程还没有执行到wait()/waitpid()函数这一步，此时子进程也时僵尸进程。

怎么避免产生僵尸进程：

1.父进程调用wait()/waitpid()函数，还要保证在子进程结束前父进程已执行到wait()/waitpid()这一步。

2.父进程先终止，子进程变成了孤儿进程，由init进程收养（pid=1），当子进程终止时，init进程会对子进程进行处理。

避免产生僵尸进程的方法：fork（）2次。

1.父进程fork（）后产生一个子进程，随后就立即执行waitpid()/wait()函数来等待子进程结束。

2.然后子进程fork（）后产生一个孙子进程，立即执行exit(0)结束子进程，然后父进程继续指向，由于孙子进程失去了它的父进程，那么孙子进程变为孤儿进程。

3.孙子进程先要指行sleep（n）这步操作，否则他可能会比他的父进程先指行，那么打印出来的ID是创建它的ID，而不是init的ID，因为在操作系统中父子进程执行的先后顺序不能确定。

4.这样孙子进程来执行它父进程需要的事件，而不会有僵尸进程出现。（父子进程共享代码段）

#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
#include<sys/types.h>
int main()
{
	pid_t id1=fork();
	if(id1==0)//child
	{
		pid_t id2=fork();  //避免僵尸进程
		if(id2>0)  //father 直接退出
		{
			exit(0);
		}
		else
		{
			sleep(2); //保证他的父进程先执行
			printf("second child de father id=%d\n",getppid()); 
			//他会成为孤儿进程，1号进程将会收养他
			exit(0);
		}
	}
	else  //father
	{
		waitpid(id1,NULL,0); //立即来等待子进程结束
	}
	return 0;
}

exec函数

1.execl函数，l代表list

int execl(const char * pathname, const char * arg0,const *arg1 .../*(char *)0*/);

要求将每个命令行参数都说明为一个单独的参数，该参数表以空指针结尾。

#include <unistd.h>
main()
{
  execl("/bin/ls", "ls", "-al", "/etc/passwd", (char *)0);
}

/*执行/bin/ls -al /etc/passwd */
-rw-r--r-- 1 root root 705 Sep 3 13 :52 /etc/passwd

2.execlp 函数，p代表该函数取filename作为参数并且用PATH环境变量寻找可执行文件

int execlp(const char *filename,const char *arg0,const char *arg1. . ./*(char *)0);

/* 执行ls -al /etc/passwd execlp()会依PATH 变量中的/bin 找到/bin/ls */
#include <unistd.h>
main()
{
  execlp("ls", "ls", "-al", "/etc/passwd", (char *)0);
}

/*运行结果
-rw-r--r-- 1 root root 705 Sep 3 13 :52 /etc/passwd
*/

解释器文件

https://blog.csdn.net/aisxyz/article/details/84908619 参考博文

当在linux系统的shell命令行上执行一个可执行文件时，系统会另起一个子进程，在子进程中内核会首先将该文件当做是二进制机器文件来执行，但是内核发现该文件不是机器文件后就会返回一个错误信息，收到错误信息后进程会将该文件看做是一个解释器文件，然后扫描该文件的第一行，获取解释器程序的名字，然后执行该解释器，并将该解释器文件当做解释器的一个参数，然后开始由解释器程序扫描整个解释器文件，执行每条语句，当然会跳过第一行语句。这就是一个解释器文件的的大概执行过程。

下面区分一下在shell命令行上，执行一个shell脚本的不同方式，假设脚本名字为test.sh，脚本位于当前目录:

(1)输入命令行：sh test.sh，这种方式是在shell中执行/bin/sh程序，然后将test.sh脚本文件作为其参数执行，/bin/sh程序会查找当前目录找到test.sh；

(2)输入命令行：./test.sh，这种方式就是上面所说的解释器文件的执行过程，shell首先会将test.sh文件当做二进制机器文件，之后会由解释器(根据第一行判断，例如可以是/bin/sh)解释执行。当然，这种方式要求test.sh必须是一个可执行文件，上述(1)可以不是。

(3)输入命令行：test.sh，这种方式和上述(2)类似，区别是(2)告诉shell在当前目录查找该文件，而该方式下，test.sh的路径必须在系统的环境变量中(即PATH变量)，否则系统找不到该可执行程序文件，值得注意的是PATH变量是没有包含当前目录的。