linux0.12-8-10-sys.c_linix c头文件 sys-CSDN博客

本文链接：https://blog.csdn.net/qq_31806069/article/details/130679689

[369页]
1、这个文件需要配合其他文件一起看才能明白函数的作用；
2、进程ID和进程组ID是描述进程之间的关系，与用户ID和组ID等其他无关系；
3、用户ID和组ID和文件（程序）属性有关，当进程执行（读取），程序（文件）将可能修改。

8-10 sys.c程序

8-10-1 功能描述

sys.c程序含有很多系统调用功能的实现函数。其中，函数若仅返回值-ENOSYS,则表示本版Linux内核还没有实现该功能，可以参考目前的代码来了解他们的实现方法。所有系统调用功能说明请参见头文件include/linux/sys.h。

该程序中含有很多关于进程ID(pid)、进程组ID(pgrp或pgid)、用户ID(uid)、用户组ID(gid)、实际用户ID(ruid)、有效用户ID(euid)以及会话ID(session)等的操作函数。下面首先对这些ID作一简要说明。

一个用户有用ID(uid)和用户组ID(gid)。这两个ID是passwd文件中对该用户设置的ID，通过被称为实际用户ID(ruid)和实际组ID(rgid)。而在每个文件的i节点信息中都
保存着宿主的用户ID和组ID，它们指明了文件拥有者和所属用户组。主要用于访问或执行文件时的权限判别操作。另外，在一个进程的任务数据结构中，为了实现不同功能而保存了3中用户ID和组ID。见表8-6.
表8-6

进程的uid和gid分别就是进程拥有者的用户ID和组ID，即进程的实际用户ID(ruid)和
实际组ID(rgid)。超级用户可以使用函数set_uid()和seg_gid对它们进行修改。有效用户ID和有效组ID用于进程访问文件时的许可权判断。

保存的用户ID(suid)和保存的组ID(sgid)用于进程访问设置了set-user-ID或set-group-ID标志的文件。当执行一个程序时，进程的euid通常就是实际用户ID,egid通常就是实际组ID。因此进程只能访问进程的有效用户、有效用户组规定的文件或其他允许访问的文件。但是如果一个文件的set-user-ID标志置位时，那么进程的有效用户ID就会被设置该文件宿主的用户ID，因此进程就可以访问设置了这种标志的受限文件，同时该文件宿主的用户ID被保存在suid中。同理，文件的seg-group-ID标志也有类似的作用并相同的处理。

例如，如果一个程序的宿主是超级用户，但(^ _ ^且)该程序设置了set-user-ID标志，那么当该程序被一个进程运行时，则该进程的有效用户ID(euid)就会被设置成超级用户的ID(0)。于是这个进程就拥有了超级用户的权限。一个实际例子就是Linux系统的passwd命令。该命令是一个设置了set-user-Id的程序，因此允许用户修改自己的口令。因为该程序需要把用户的新口令写入/etc/passwd文件中，而该文件只有超级用户才有写权限，因此passwd程序就需要使用set-user-ID标志。

另外，进程也有标识自己属性的进程ID(pid)、所属进程组的进程组ID(pgrp或pgid)和所属会话的会话ID(session)。这3个ID用于表明进程与进程之间的关系，与用户ID和组ID无关。

8-10-2 代码注释

/*
 *  linux/kernel/sys.c
 *
 *  (C) 1991  Linus Torvalds
 */

#include <errno.h>// 错误号头文件。包含系统中各种出错号。

#include <linux/sched.h>// 调度程序头文件。定义了任务结构task_struct、任务0的数据，
						// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/tty.h>// tty头文件，定义了有关tty_io，串行通信方面的参数、常数。
#include <linux/kernel.h>// 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/config.h>// 内核常数配置文件。这里主要使用其中的系统名称常数符号信息。
#include <asm/segment.h>// 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <sys/times.h>// 定义了进程中运行时间的结构tms以及times()函数原型。
#include <sys/utsname.h>// 系统名称结构头文件。
#include <sys/param.h>// 系统参数头文件。含有系统一些全局常数符号。例如HZ等。
#include <sys/resource.h>// 系统资源头文件。含有有关进程资源使用情况的结构等信息。
#include <string.h>// 字符串头文件。字符串或内存字节序列操作函数。

/*
 * 本系统所在的时区（timezone）。作为某些程序使用gettimeofday系统调用获取
 * 时区的默认值。
 */
// 时区结构timezone第1个字段（tz_minuteswest）表示距格林尼治标准时间GMT以西的分钟
// 数；第2个字段（tz_dsttime）是夏令时DST（Daylight Savings Time）调整类型。 该结构
// 定义在include/sys/time.h中。
struct timezone sys_tz = { 0, 0};
// 根据进程组号pgrp取得进程组所属会话（session）号。该函数在kernel/exit.c中实现。
extern int session_of_pgrp(int pgrp);

// 返回日期和时间（ftime – Fetch time）。
// 以下返回值是-ENOSYS的系统调用函数均表示在本版本内核中还未实现。
int sys_ftime()
{
	return -ENOSYS;
}

int sys_break()
{
	return -ENOSYS;
}
// 用于当前进程对子进程进行调试(debugging)
int sys_ptrace()
{
	return -ENOSYS;
}
// 改变并打印终端行设置。
int sys_stty()
{
	return -ENOSYS;
}
// 取终端行设置信息。
int sys_gtty()
{
	return -ENOSYS;
}
// 修改文件名。
int sys_rename()
{
	return -ENOSYS;
}

int sys_prof()
{
	return -ENOSYS;
}

/*
 * 以下是BSD形式的实现，没有考虑保存的gid（saved gid或sgid），除了当你
 * 设置了有效的gid（effective gid或egid）时，保存的gid也会被设置。这使
 * 得一个使用setgid的程序可以完全放弃其特权。当你在对一个程序进行安全审
 * 计时，这通常是一种很好的处理方法。
 *
 * 最基本的考虑是一个使用setregid()的程序将会与BSD系统100%的兼容。而一
 * 个使用setgid()和保存的gid的程序将会与POSIX 100%的兼容。
 */
// 设置当前任务的实际以及/或者有效组ID（gid）。如果任务没有超级用户特权，那么只能互
// 换其实际组ID 和有效组 ID。如果任务具有超级用户特权，就能任意设置有效的和实际的组
// ID。保留的gid（saved gid）被设置成与有效gid。实际组ID是指进程当前的gid。
int sys_setregid(int rgid, int egid)
{
	if (rgid>0) {
		if ((current->gid == rgid) || 
		    suser())
			current->gid = rgid;
		else
			return(-EPERM);
	}
	if (egid>0) {
		if ((current->gid == egid) ||
		    (current->egid == egid) ||
		    suser()) {
			current->egid = egid;
			current->sgid = egid;
		} else
			return(-EPERM);
	}
	return 0;
}

/*
 * setgid()的实现与具有SAVED_IDS的SYSV的实现方法相似。
 */
// 设置进程组号(gid)。如果任务没有超级用户特权，它可以使用 setgid() 将其有效gid
// （effective gid）设置为成其保留gid(saved gid)或其实际gid(real gid)。如果任务
// 有超级用户特权，则实际gid、有效gid和保留gid都被设置成参数指定的gid。
int sys_setgid(int gid)
{
	if (suser())
		current->gid = current->egid = current->sgid = gid;
	else if ((gid == current->gid) || (gid == current->sgid))
		current->egid = gid;
	else
		return -EPERM;
	return 0;
}
// 打开或关闭进程计帐功能。
int sys_acct()
{
	return -ENOSYS;
}
// 映射任意物理内存到进程的虚拟地址空间。
int sys_phys()
{
	return -ENOSYS;
}

int sys_lock()
{
	return -ENOSYS;
}

int sys_mpx()
{
	return -ENOSYS;
}

int sys_ulimit()
{
	return -ENOSYS;
}
// 返回从 1970年1月1日00:00:00 GMT 开始计时的时间值（秒）。如果tloc不为null，
// 则时间值也存储在那里。
// 由于参数是一个指针，而其所指位置在用户空间，因此需要使用函数 put_fs_long() 来
// 访问该值。在进入内核中运行时，段寄存器fs被默认地指向当前用户数据空间。因此该
// 函数就可利用fs来访问用户空间中的值。
int sys_time(long * tloc)
{
	int i;

	i = CURRENT_TIME;
	if (tloc) {
		verify_area(tloc,4);// 验证内存容量是否够（这里是4字节）。
		put_fs_long(i,(unsigned long *)tloc);// 放入用户数据段tloc处。
	}
	return i;
}

/*
 * 无特权的用户可以见实际的uid（real uid）改成有效的uid（effective uid），
 * 反之也然。（BSD形式的实现）
 *
 * 当你设置有效的uid 时，它同时也设置了保存的 uid。这使得一个使用 setuid
 * 的程序可以完全放弃其特权。当你在对一个程序进行安全审计时，这通常是一种
 * 很好的处理方法。
 * 最基本的考虑是一个使用 setreuid()的程序将会与 BSD系统100%的兼容。而一
 * 个使用setuid()和保存的gid的程序将会与POSIX 100%的兼容。
 */
// 设置任务的实际以及/或者有效的用户ID（uid）。如果任务没有超级用户特权，那么只能
// 互换其实际的uid 和有效的uid。如果任务具有超级用户特权，就能任意设置有效的和实
// 际的用户ID。保存的uid（saved uid）被设置成与有效uid同值。
int sys_setreuid(int ruid, int euid)
{
	int old_ruid = current->uid;
	
	if (ruid>0) {
		if ((current->euid==ruid) ||
                    (old_ruid == ruid) ||
		    suser())
			current->uid = ruid;
		else
			return(-EPERM);
	}
	if (euid>0) {
		if ((old_ruid == euid) ||
                    (current->euid == euid) ||
		    suser()) {
			current->euid = euid;
			current->suid = euid;
		} else {
			current->uid = old_ruid;
			return(-EPERM);
		}
	}
	return 0;
}

/*
 * setuid()的实现与具有SAVED_IDS的SYSV的实现方法相似。
 *
 * 请注意使用SAVED_ID的setuid()在某些方面是不完善的。例如，一个使用
 * setuid的超级用户程序sendmail就做不到把其uid设置成一个普通用户的
 * uid，然后再交换回来。 因为如果你是一个超级用户，setuid() 也同时会
 * 设置保存的uid。如果你不喜欢这样的做法的话，就责怪POSIX组委会以及
 * /或者USG中的聪明人吧。不过请注意BSD形式的setreuid()实现能够允许
 * 一个超级用户程序临时放弃特权，并且能通过交换实际的和有效的 uid 而
 * 再次获得特权。
 */
// 设置任务用户ID（uid）。如果任务没有超级用户特权，它可以使用setuid()将其有效的
// uid（effective uid）设置成其保存的uid（saved uid）或其实际的uid（real uid）。
// 如果任务有超级用户特权，则实际的uid、有效的uid和保存的uid都会被设置成参数指
// 定的uid。
int sys_setuid(int uid)
{
	if (suser())
		current->uid = current->euid = current->suid = uid;
	else if ((uid == current->uid) || (uid == current->suid))
		current->euid = uid;
	else
		return -EPERM;
	return(0);
}
// 设置系统开机时间。参数tptr是从1970年1月1日00:00:00 GMT开始计时的时间值（秒）。
// 调用进程必须具有超级用户权限。其中HZ=100，是内核系统运行频率。
// 由于参数是一个指针，而其所指位置在用户空间，因此需要使用函数get_fs_long()来访问该
// 值。在进入内核中运行时，段寄存器 fs 被默认地指向当前用户数据空间。因此该函数就可利
// 用fs来访问用户空间中的值。
// 函数参数提供的当前时间值减去系统已经运行的时间秒值（jiffies/HZ）即是开机时间秒值。
int sys_stime(long * tptr)
{
	if (!suser())// 如果不是超级用户则出错返回（许可）。
		return -EPERM;
	startup_time = get_fs_long((unsigned long *)tptr) - jiffies/HZ;
	jiffies_offset = 0;
	return 0;
}
// 获取当前任务运行时间统计值。
// 在tbuf所指用户数据空间处返回tms结构的任务运行时间统计值。tms结构中包括进程用户
// 运行时间、内核（系统）时间、子进程用户运行时间、子进程系统运行时间。函数返回值是
// 系统运行到当前的嘀嗒数。
int sys_times(struct tms * tbuf)
{
	if (tbuf) {
		verify_area(tbuf,sizeof *tbuf);
		put_fs_long(current->utime,(unsigned long *)&tbuf->tms_utime);
		put_fs_long(current->stime,(unsigned long *)&tbuf->tms_stime);
		put_fs_long(current->cutime,(unsigned long *)&tbuf->tms_cutime);
		put_fs_long(current->cstime,(unsigned long *)&tbuf->tms_cstime);
	}
	return jiffies;
}
// 当参数end_data_seg数值合理，并且系统确实有足够的内存，而且进程没有超越其最大数据
// 段大小时，该函数设置数据段末尾为end_data_seg指定的值。该值必须大于代码结尾并且要
// 小于堆栈结尾16KB。返回值是数据段的新结尾值（如果返回值与要求值不同，则表明有错误
// 发生）。该函数并不被用户直接调用，而由libc库函数进行包装，并且返回值也不一样。
int sys_brk(unsigned long end_data_seg)
{
// 如果参数值大于代码结尾，并且小于（堆栈 - 16KB），则设置新数据段结尾值。
	if (end_data_seg >= current->end_code &&
	    end_data_seg < current->start_stack - 16384)
		current->brk = end_data_seg;
	return current->brk;// 返回进程当前的数据段结尾值。
}

/*
 * 下面代码需要某些严格的检查…
 * 我只是没有胃口来做这些。我也不完全明白sessions/pgrp等的含义。还是让
 * 了解它们的人来做吧。
 *
 * OK，我想我已经正确地实现了保护语义...。总之，这其实只对多用户系统是
 * 重要的，以确定一个用户不能向其他用户的进程发送信号。 -TYT 12/12/91
 */
// 设置指定进程pid的进程组号为pgid。
// 参数pid 是指定进程的进程号。如果它为0，则让pid等于当前进程的进程号。参数pgid
// 是指定的进程组号。如果它为0，则让它等于进程pid的进程组号。如果该函数用于将进程
// 从一个进程组移到另一个进程组，则这两个进程组必须属于同一个会话(session)。在这种
// 情况下，参数pgid 指定了要加入的现有进程组ID，此时该组的会话ID必须与将要加入进
// 程的相同(263行)。
int sys_setpgid(int pid, int pgid)
{
	int i; 
    // 如果参数pid为0，则pid取值为当前进程的进程号pid。如果参数pgid为0，则pgid也
    // 取值为当前进程的pid。[?? 这里与POSIX标准的描述有出入 ]。若 pgid小于0，则返回
    // 无效错误码。
	if (!pid)
		pid = current->pid;
	if (!pgid)
		pgid = current->pid;
	if (pgid < 0)
		return -EINVAL;
	// 扫描任务数组，查找指定进程号 pid 的任务。如果找到了进程号是pid 的进程，并且该进程
    // 的父进程就是当前进程或者该进程就是当前进程，那么若该任务已经是会话首领，则出错返回。
    // 若该任务的会话号（session）与当前进程的不同，或者指定的进程组号pgid与pid不同并且
    // pgid 进程组所属会话号与当前进程所属会话号不同，则也出错返回。 否则把查找到的进程的
    // pgrp设置为pgid，并返回0。若没有找到指定pid的进程，则返回进程不存在出错码。
	for (i=0 ; i<NR_TASKS ; i++)
		if (task[i] && (task[i]->pid == pid) &&
		    ((task[i]->p_pptr == current) || 
		     (task[i] == current))) {
			if (task[i]->leader)
				return -EPERM;
			if ((task[i]->session != current->session) ||
			    ((pgid != pid) && 
			     (session_of_pgrp(pgid) != current->session)))
				return -EPERM;
			task[i]->pgrp = pgid;
			return 0;
		}
	return -ESRCH;
}
// 返回当前进程的进程组号。与getpgid(0)等同。
int sys_getpgrp(void)
{
	return current->pgrp;
}
// 创建一个会话(session)（即设置其leader=1），并且设置其会话号=其组号=其进程号。
// 如果当前进程已是会话首领并且不是超级用户，则出错返回。否则设置当前进程为新会话
// 首领（leader = 1），并且设置当前进程会话号 session和组号pgrp都等于进程号pid，
// 而且设置当前进程没有控制终端。最后系统调用返回会话号。
int sys_setsid(void)
{
	if (current->leader && !suser())
		return -EPERM;
	current->leader = 1;
	current->session = current->pgrp = current->pid;
	current->tty = -1;// 表示当前进程没有控制终端。
	return current->pgrp;
}

/*
 * 进程的其他用户组号。
 */
// 取当前进程其他辅助用户组号。
// 任务数据结构中groups[]数组保存着进程同时所属的多个用户组号。该数组共NGROUPS个项，
// 若某项的值是NOGROUP（即为 -1），则表示从该项开始以后所有项都空闲。否则数组项中保
// 存的是用户组号。
// 参数gidsetsize是获取的用户组号个数；grouplist是存储这些用户组号的用户空间缓存。
int sys_getgroups(int gidsetsize, gid_t *grouplist)
{
	int	i;
    // 首先验证grouplist指针所指的用户缓存空间是否足够，然后从当前进程结构的groups[]
    // 数组中逐个取得用户组号并复制到用户缓存中。在复制过程中，如果 groups[] 中的项数
    // 大于给定的参数 gidsetsize 所指定的个数，则表示用户给出的缓存太小，不能容下当前
    // 进程所有组号，因此此次取组号操作会出错返回。若复制过程正常，则函数最后会返回复
    // 制的用户组号个数。（gidsetsize – gid set size，用户组号集大小）。
	if (gidsetsize)
		verify_area(grouplist, sizeof(gid_t) * gidsetsize);

	for (i = 0; (i < NGROUPS) && (current->groups[i] != NOGROUP);
	     i++, grouplist++) {
		if (gidsetsize) {
			if (i >= gidsetsize)
				return -EINVAL;
			put_fs_word(current->groups[i], (short *) grouplist);
		}
	}
	return(i);// 返回实际含有的用户组号个数。
}
// 设置当前进程同时所属的其他辅助用户组号。
// 参数gidsetsize是将设置的用户组号个数；grouplist是含有用户组号的用户空间缓存。
int sys_setgroups(int gidsetsize, gid_t *grouplist)
{
	int	i;
    // 首先查权限和参数的有效性。只有超级用户可以修改或设置当前进程的辅助用户组号，而且
    // 设置的项数不能超过进程的groups[NGROUPS]数组的容量。然后从用户缓冲中逐个复制用户
    // 组号，共gidsetsize个。如果复制的个数没有填满groups[]，则在随后一项上填上值为-1
    // 的项（NOGROUP）。最后函数返回0。
	if (!suser())
		return -EPERM;
	if (gidsetsize > NGROUPS)
		return -EINVAL;
	for (i = 0; i < gidsetsize; i++, grouplist++) {
		current->groups[i] = get_fs_word((unsigned short *) grouplist);
	}
	if (i < NGROUPS)
		current->groups[i] = NOGROUP;
	return 0;
}
// 检查当前进程是否在指定的用户组grp中。是则返回1，否则返回0。
int in_group_p(gid_t grp)
{
	int	i;
    // 如果当前进程的有效组号就是grp，则表示进程属于grp进程组。函数返回1。否则就在
    // 进程的辅助用户组数组中扫描是否有 grp 进程组号。若有则函数也返回1。若扫描到值
    // 为 NOGROUP 的项，表示已扫描完全部有效项而没有发现匹配的组号，因此函数返回0。
	if (grp == current->egid)
		return 1;

	for (i = 0; i < NGROUPS; i++) {
		if (current->groups[i] == NOGROUP)
			break;
		if (current->groups[i] == grp)
			return 1;
	}
	return 0;
}
// utsname结构含有一些字符串字段。用于保存系统的名称。其中包含5个字段，分别是：
// 当前操作系统的名称、网络节点名称（主机名）、当前操作系统发行级别、操作系统版本
// 号以及系统运行的硬件类型名称。该结构定义在 include/sys/utsname.h 文件中。 这里
// 内核使用 include/linux/config.h 文件中的常数符号设置了它们的默认值。它们分别为
// “Linux”，“(none)”，“0”，“0.12”，“i386”。
static struct utsname thisname = {
	UTS_SYSNAME, UTS_NODENAME, UTS_RELEASE, UTS_VERSION, UTS_MACHINE
};
// 获取系统名称等信息。
int sys_uname(struct utsname * name)
{
	int i;

	if (!name) return -ERROR;
	verify_area(name,sizeof *name);
	for(i=0;i<sizeof *name;i++)
		put_fs_byte(((char *) &thisname)[i],i+(char *) name);
	return 0;
}

/*
 * 通过调用uname()只能实现sethostname和gethostname。
 */
// 设置系统主机名（系统的网络节点名）。
// 参数name指针指向用户数据区中含有主机名字符串的缓冲区；len是主机名字符串长度。
int sys_sethostname(char *name, int len)
{
	int	i;
// 系统主机名只能由超级用户设置或修改，并且主机名长度不能超过最大长度MAXHOSTNAMELEN。	
	if (!suser())
		return -EPERM;
	if (len > MAXHOSTNAMELEN)
		return -EINVAL;
	for (i=0; i < len; i++) {
		if ((thisname.nodename[i] = get_fs_byte(name+i)) == 0)
			break;
	}
	// 在复制完毕后，如果用户提供的字符串中没有包含NULL字符，那么若复制的主机名长度还没有
    // 超过 MAXHOSTNAMELEN，则在主机名字符串后添加一个NULL。若已经填满 MAXHOSTNAMELEN个字
    // 符，则把最后一个字符改成NULL字符。即thisname.nodename[min(i,MAXHOSTNAMELEN)] = 0。
	if (thisname.nodename[i]) {
		thisname.nodename[i>MAXHOSTNAMELEN ? MAXHOSTNAMELEN : i] = 0;
	}
	return 0;
}
// 取当前进程指定资源的界限值。
// 进程的任务结构中定义有一个数组rlim[RLIM_NLIMITS]，用于控制进程使用系统资源的界限。
// 数组每个项是一个rlimit 结构，其中包含两个字段。 一个说明进程对指定资源的当前限制
// 界限（soft limit，即软限制），另一个说明系统对指定资源的最大限制界限（hard limit，
// 即硬限制）。 rlim[] 数组的每一项对应系统对当前进程一种资源的界限信息。Linux 0.12
// 系统共对6种资源规定了界限，即RLIM_NLIMITS=6。请参考头文件include/sys/resource.h
// 中第41 — 46行的说明。
// 参数 resource 指定我们咨询的资源名称，实际上它是任务结构中rlim[]数组的索引项值。
// 参数rlim是指向rlimit结构的用户缓冲区指针，用于存放取得的资源界限信息。
int sys_getrlimit(int resource, struct rlimit *rlim)
{
// 所咨询的资源resource实际上是进程任务结构中rlim[]数组的索引项值。该索引值当然不能
// 大于数组的最大项数 RLIM_NLIMITS。在验证过 rlim 指针所指用户缓冲足够以后，这里就把
// 参数指定的资源resource结构信息复制到用户缓冲中，并返回0。
	if (resource >= RLIM_NLIMITS)
		return -EINVAL;
	verify_area(rlim,sizeof *rlim);
	put_fs_long(current->rlim[resource].rlim_cur, // 当前（软）限制值。
		    (unsigned long *) rlim);
	put_fs_long(current->rlim[resource].rlim_max, // 系统（硬）限制值。
		    ((unsigned long *) rlim)+1);
	return 0;	
}
// 设置当前进程指定资源的界限值。
// 参数 resource 指定我们设置界限的资源名称，实际上它是任务结构中rlim[]数组的索引
// 项值。参数rlim是指向rlimit结构的用户缓冲区指针，用于内核读取新的资源界限信息。
int sys_setrlimit(int resource, struct rlimit *rlim)
{
	struct rlimit new, *old;
    // 首先判断参数resource（任务结构rlim[]项索引值）有效性。然后先让rlimit结构指针
    // old指向指进程任务结构中指定资源的当前rlimit结构信息。接着把用户提供的资源界限
    // 信息复制到临时rlimit结构new中。此时如果判断出new结构中的软界限值或硬界限值
    // 大于进程该资源原硬界限值，并且当前不是超级用户的话，就返回许可错。否则表示new
    // 中信息合理或者进程是超级用户进程，则修改原进程指定资源信息等于new结构中的信息，
    // 并成功返回0。
	if (resource >= RLIM_NLIMITS)
		return -EINVAL;
	old = current->rlim + resource;// 即old = current->rlim[resource]。
	new.rlim_cur = get_fs_long((unsigned long *) rlim);
	new.rlim_max = get_fs_long(((unsigned long *) rlim)+1);
	if (((new.rlim_cur > old->rlim_max) ||
	     (new.rlim_max > old->rlim_max)) &&
	    !suser())
		return -EPERM;
	*old = new;
	return 0;
}

/*
 * 把rusuage结构放进任务结构task struct中是恰当的，除非它会使任务
 * 结构长度变得非常大。在把任务结构移入内核malloc分配的内存中之后，
 * 这样做即使任务结构很大也没问题了。这将使得其余信息的移动变得非常
 * 方便！（我们还没有这样做，因为我们还没有测试过它们的大小）。
 */
// 获取指定进程的资源利用信息。
// 本系统调用提供当前进程或其已终止的和等待着的子进程资源使用情况。如果参数who等于
// RUSAGE_SELF，则返回当前进程的资源利用信息。如果指定进程who 是 RUSAGE_CHILDREN，
// 则返回当前进程的已终止和等待着的子进程资源利用信息。 符号常数RUSAGE_SELF 和
// RUSAGE_CHILDREN 以及 rusage结构都定义在 include/sys/resource.h头文件中。
int sys_getrusage(int who, struct rusage *ru)
{
	struct rusage r;
	unsigned long	*lp, *lpend, *dest;
    // 首先判断参数指定进程的有效性。如果who既不是RUSAGE_SELF（指定当前进程），也不是
    // RUSAGE_CHILDREN （指定子进程），则以无效参数码返回。否则在验证了指针ru 指定的用
    // 户缓冲区域后，把临时 rusage结构区域r清零。
	if (who != RUSAGE_SELF && who != RUSAGE_CHILDREN)
		return -EINVAL;
	verify_area(ru, sizeof *ru);
	memset((char *) &r, 0, sizeof(r));// 在include/strings.h文件最后。
	// 若参数who 是RUSAGE_SELF，则复制当前进程资源利用信息到r结构中。若指定进程who
    // 是RUSAGE_CHILDREN， 则复制当前进程的已终止和等待着的子进程资源利用信息到临时
    // rusuage结构r中。宏CT_TO_SECS 和CT_TO_USECS用于把系统当前嘀嗒数转换成用秒值
    // 加微秒值表示。它们定义在 include/linux/sched.h 文件中。 jiffies_offset是系统
    // 嘀嗒数误差调整数。
	if (who == RUSAGE_SELF) {
		r.ru_utime.tv_sec = CT_TO_SECS(current->utime);
		r.ru_utime.tv_usec = CT_TO_USECS(current->utime);
		r.ru_stime.tv_sec = CT_TO_SECS(current->stime);
		r.ru_stime.tv_usec = CT_TO_USECS(current->stime);
	} else {
		r.ru_utime.tv_sec = CT_TO_SECS(current->cutime);
		r.ru_utime.tv_usec = CT_TO_USECS(current->cutime);
		r.ru_stime.tv_sec = CT_TO_SECS(current->cstime);
		r.ru_stime.tv_usec = CT_TO_USECS(current->cstime);
	}
	// 然后让lp指针指向r结构，lpend指向r结构末尾处，而dest指针指向用户空间中的ru
    // 结构。最后把r中信息复制到用户空间ru结构中，并返回0。
	lp = (unsigned long *) &r;
	lpend = (unsigned long *) (&r+1);
	dest = (unsigned long *) ru;
	for (; lp < lpend; lp++, dest++) 
		put_fs_long(*lp, dest);
	return(0);
}
// 取得系统当前时间，并用指定格式返回。
// timeval结构和timezone结构都定义在include/sys/time.h文件中。timeval结构含有秒
// 和微秒（tv_sec和tv_usec）两个字段。timezone结构含有本地距格林尼治标准时间以西
// 的分钟数（tz_minuteswest）和夏令时间调整类型（tz_dsttime）两个字段。
// （dst -- Daylight Savings Time）
int sys_gettimeofday(struct timeval *tv, struct timezone *tz)
{
    // 如果参数给定的timeval结构指针不空，则在该结构中返回当前时间（秒值和微秒值）；
    // 如果参数给定的用户数据空间中 timezone结构的指针不空，则也返回该结构的信息。
    // 程序中startup_time是系统开机时间（秒值）。 宏CT_TO_SECS和CT_TO_USECS用于
    // 把系统当前嘀嗒数转换成用秒值加微秒值表示。它们定义在include/linux/sched.h
    // 文件中。jiffies_offset是系统嘀嗒数误差调整数。
	if (tv) {
		verify_area(tv, sizeof *tv);
		put_fs_long(startup_time + CT_TO_SECS(jiffies+jiffies_offset),
			    (unsigned long *) tv);
		put_fs_long(CT_TO_USECS(jiffies+jiffies_offset), 
			    ((unsigned long *) tv)+1);
	}
	if (tz) {
		verify_area(tz, sizeof *tz);
		put_fs_long(sys_tz.tz_minuteswest, (unsigned long *) tz);
		put_fs_long(sys_tz.tz_dsttime, ((unsigned long *) tz)+1);
	}
	return 0;
}

/*
 * 在第1次设置时区（timezone）时，我们会改变时钟值以让系统使用格林
 * 尼治标准时间（GMT）运行，而非使用本地时间。 推测起来说，如果某人
 * 设置了时区时间，那么我们就运行在程序知晓时区时间的环境中。设置时
 * 区操作应该在系统启动阶段，尽快地在/etc/rc脚本程序中进行。这样时
 * 钟就可以设置正确。 否则的话，若我们以后才设置时区而导致时钟时间
 * 改变，可能会让一些程序的运行出现问题。
 */
// 设置系统当前时间。
// 参数tv是指向用户数据区中timeval结构信息的指针。参数tz是用户数据区中timezone
// 结构的指针。该操作需要超级用户权限。如果两者皆为空，则什么也不做，函数返回0。
int sys_settimeofday(struct timeval *tv, struct timezone *tz)
{
	static int	firsttime = 1;
	void 		adjust_clock();
    // 设置系统当前时间需要超级用户权限。如果tz指针不空，则设置系统时区信息。即复制用户
    // timezone结构信息到系统中的 sys_tz结构中（见第24行）。如果是第1次调用本系统调用
    // 并且参数tv指针不空，则调整系统时钟值。
	if (!suser())
		return -EPERM;
	if (tz) {
		sys_tz.tz_minuteswest = get_fs_long((unsigned long *) tz);
		sys_tz.tz_dsttime = get_fs_long(((unsigned long *) tz)+1);
		if (firsttime) {
			firsttime = 0;
			if (!tv)
				adjust_clock();
		}
	}
	// 如果参数的timeval结构指针tv不空，则用该结构信息设置系统时钟。首先从tv所指处
    // 获取以秒值（sec）加微秒值（usec）表示的系统时间，然后用秒值修改系统开机时间全局
    // 变量startup_time值，并用微秒值设置系统嘀嗒误差值jiffies_offset。
	if (tv) {
		int sec, usec;

		sec = get_fs_long((unsigned long *)tv);
		usec = get_fs_long(((unsigned long *)tv)+1);
	
		startup_time = sec - jiffies/HZ;
		jiffies_offset = usec * HZ / 1000000 - jiffies%HZ;
	}
	return 0;
}
/*
 * 把从CMOS中读取的时间值调整为GMT时间值保存，而非本地时间值。
 *
 * 这里的做法很蹩脚，但要比其他方法好。否则我们就需要写一个程序并让它
 * 在/etc/rc中运行来做这件事（并且冒着该程序可能会被多次执行而带来的
 * 问题。 而且这样做也很难让程序把时钟精确地调整n小时） 或者把时区信
 * 息编译进内核中。当然这样做就非常、非常差劲了...
 *
 * 目前下面函数（XXX）的调整操作并没有考虑到夏令时问题。依据BIOS有多
 * 么智能（愚蠢？）也许根本就不用考虑这方面。当然，最好的做法是完全不
 * 依赖于CMOS时钟，而是让系统通过NTP（网络时钟协议）或者timed（时间
 * 服务器）获得时间，如果机器联上网的话...。        - TYT，1/1/92
 */
// 把系统启动时间调整为以GMT为标准的时间。
// startup_time是秒值，因此这里需要把时区分钟值乘上60。
void adjust_clock()
{
	startup_time += sys_tz.tz_minuteswest*60;
}
// 设置当前进程创建文件属性屏蔽码为mask & 0777。并返回原屏蔽码。
int sys_umask(int mask)
{
	int old = current->umask;

	current->umask = mask & 0777;
	return (old);
}