内存管理子系统
逻辑地址(逻辑地址=段基地址+偏移量)通过段式管理单元转换为线性地址,线性地址通过页式管理单元转换为物理地址(物理地址=段寄存器*16+逻辑地址)。
段的起始地址是16的倍数,其最大长度不能超过64K。
在/proc/<pid>/maps文件中可以查看进程的地址信息
内核异常
Oops可以看成是内核级的SegmentationFault(段错误)。应用程序如果进行了非法内存访问或知执行了非法指令(非法指针,地址小于0xC0000000的指针)会得到SegFault信号,一般的行为coredump,应用程序也可以自己截获此信号。
进程管理
进程的状态:(对应task_struct结构体中的volatile long state成员)
1、 TASK_RUNNING(就绪和运行态)表示这在被CPU执行,或者已经就绪,随时可以执行的进程。当一个进程被创建时处于此状态
2、 TASK_INTERRUPTBLE(阻塞态)处于等待中的进程,待条件为真时被唤醒,也可被信号或者中断唤醒
3、 TASK_UNINTERRUPTBLE(不可中断状态) 处于等待中的进程,待资源有效时被唤醒,不可被信号或中断唤醒
4、 TASK_STOPPED(中止执行)接收到SIGSTOP和SIGTSTP信号时,进入该状态,接收到SIGCONT信号时回到TASK_RUNNING状态
5、 TASK_KILLABLE(睡眠状态)类似TASK_UNINTERRUPTBLE但可以被信号SIGKILL唤醒
6、 TASK_TRACED(调试态)处于调试状态的进程。
7、 TASK_DEAD(进程退出状态)进程退出时设置为此状态
进程对出状态:(对应task_struct结构体中的int exit_state成员)
1、 EXIT_ZOMBIE(僵死进程)表示进程的执行被终止,父进程还没有调用waitpid()处理死亡进程信息。
2、 EXIT_DEAD(僵死撤销状态)进程最终状态,父进程调用wait4()或者waitpid()进行了进程信息处理
current指向当前正在执行的进程。
进程调度(pick_next_task选出下一个要执行的进程)
- SCHED_NORMAL(SCHED_OTHER)普通的分时进程
- SCHED_BATCH批处理进程
- SCHED_IDLE只在系统空闲时才能被调度执行的进程
- SCHED_FIFO先来先服务的实时进程
- SCHED_RR时间片轮转进程
注:前三种为CFS调度类(公平调度类),后两种为实时调度类。调度分为主动调度(直接调用schedule())和被动式调度(抢占(内核抢占、用户抢占))。内核正在执行中断处理程序、内核正在进行中断上下文的Bottom Half(底半部)处理、进程正持有spinlock自旋锁 writelock/readlock读写锁、内核正在执行调度程序Scheduler时不允许内核抢占(是否可以抢占由thread_info中的preempt_count决定)。
内核即将返回用户空间的时候,如果need_resched标志被设置,会导致schedule()被调用,此时发生用户抢占。
中断处理程序完成,返回内核空间之前。
Proc文件系统
proc文件系统作用:一是查询当前内核状态;二是配置内核状态。
创建proc文件,name是要创建的文件名;mode要创建的文件的属性;parent指定创建文件的父目录。
struct proc_dir_entry*create_proc_entry(const char *name, mode_t mode,
structproc_dir_entry *parent)
创建proc目录,name要创建的目录名;parent指定创建目录的父目录
struct proc_dir_entry*proc_mkdir(const char *name,struct proc_dir_entry *parent)
删除proc目录或文件,name为要删除的文件或目录名;parent为所在的父目录
/* Remove a /proc entry andfree it if it's not currently in use.*/
void remove_proc_entry(constchar *name, struct proc_dir_entry *parent)
mmap系统调用(用户空间)
内存映射函数mmap,负责吧文件内容映射到进程的虚拟内存空间,通过这段内存的读取和修改,来实现对文件的读取和修改,而不需要在调用read、write等操作。
void *mmap(void *addr,size_t len,int port,int flags,int fd,off_toffset)
addr是指定映射的起始地址,一般设置为NULL,由系统指定。Length映射到内存的文件长度。Prot映射区的保护方式(PROT_EXEC可被执行,PROT_READ可被读取,PROT_WRITE可被写入)。Flags映射区的特性(MAP_SHARED写回映射区的数据会复制回文件,且允许其他映射改文件的进程共享;MAP_PRICATE对映射区的写入操作会产生一个映射区的赋值,对此区域所做的修改不会写回源文件)。Fd要操作的文件描述符。Offset以文件开始处的偏移量,必须是分页大小的整数倍,通常为0,表示从头开始映射。
int munmap(void *start,size_t length)取消映射,start为映射的开始地址,length为大小。
int remap_pfn_range(struct vm_area_struct *vma, unsigned longaddr,
unsigned long pfn, unsigned long size,pgprot_t prot)
构造页表。vma虚拟内存区域指针,virt_addr虚拟地址的起始值,pfn要映射的物理地址所在的物理页帧号,可将物理地址>>PAGE_SHIFT得到,size要映射区域的大小,port vma的保护属性。
字符设备驱动
内核中代表打开的文件:
struct file
内核中保存文件物理信息:
struct inode
内核中函数指针集合:
struct file_operations
MAJOR(dev_t dev)分解出主设备号,MINOR(dev_tdev)分解出次设备号。
在Documentation/devices.txt,确定一个没有使用的主设备号
静态申请设备号:
int register_chrdev_region(dev_t from, unsigned count, constchar *name)申请使用from开始的count个设备号。From希望申请使用的设备号,count希望申请使用设备号数目,name设备名。
动态申请设备号:
int alloc_chrdev_region(dev_t *dev, unsigned baseminor, unsignedcount,const char *name)请求动态申请count个设备号,此设备号从baseminor开始。Dev分配到的设备号,baseminor起始次设备号,count需要分配的设备号数目,name设备名。
注销设备号:
void unregister_chrdev_region(dev_t from, unsigned count)释放从from开始的count个设备号。
创建设备文件:
mknod filename type major minor
filename设备文件名;type设备类型;major主设备号;minor次设备号。
设备注册(初始化):
void cdev_init(struct cdev *cdev, const struct file_operations*fops)cdev待初始化的cdev结构;fops设备对应的操作函数集。
设备添加:
int cdev_add(struct cdev *p, dev_t dev, unsigned count)p待添加的字符设备结构;dev设备号;count添加的设备个数。
等待队列
定义等待队列:
wait_queue_head_t my_queue
初始化等待队列:
init_waitqueue_head(&my_queue)
定义并初始化等待队列:
DECLARE_WAIT_QUEUE_HEAD(my_queue)
定义等待队列元素:
DECLARE_WAITQUEUE(name,tsk)
添加/移除等待队列:(将等待队列元素wait添加/删除从q所指的双向链表中)
void add_wait_queue(wait_queue_head_t *q,wait_queue_t *wait);
void remove_wait_queue(wait_queue_head_t *q,wait_queue_t *wait);
等待事件:
wait_event(queue,condition);有条件睡眠,condition为假则进入睡眠,为真立即返回。
wait_event_interruptible(queue,condition);可以被信号打断
wait_event_timeout(queue,condition,timeout);等待时间到达,则直接返回。
wait_event_interruptible(queue,condition,timeout);
唤醒队列:
voidwake_up(wait_queue_head_t *queue);与wait_event/ wait_event_timeout成对使用
voidwake_up_interruptible(wait_queue_head_t *queue); 与wait_event_interruptible或wait_event_interruptible成对使用。
在等待队列上睡眠:
sleep_on(wait_queue_head_t*q);将目前进程的状态置为TASK_UNINTERRUPTTIBLE,并定义一个等待队列元素,之后把它挂到等到队列头部q指向的双向链表,直到资源可获得,q队列指向链接的进程被唤醒。
interruptible(wait_queue_head_t*q); 将目前进程的状态置为TASK_INTERRUPTTIBLE,并定义一个等待队列元素,之后把它挂到等到队列头部q指向的双向链表,直到资源可获得或者进程收到信号。
select系统调用:
用于多路监控,当没有一个文件慢足要求时,select将阻塞调用进程。正常情况下返回满足要求的文件描述符个数,超时返回0,被中断返回-1并设置errno为EINTR,出错返回-1并设置errno
int select(intmaxfd,fd_set *readfds,fd_set *writefds,fe_set *exceptfds,const struct timeval*timeout)maxfd是文件描述符的范围,比待检测的最大文件描述符大1;readfds被监控的文件描述符集;writefds被写监控的文件描述符集;exceptfds被异常监控的文件描述符集;timeout定时器
步骤:
一将监控的文件添加到文件描述符集;二调用select开始监控;三判断是否发生变化。
FD_SET添加文件描述符fd到fdset文件描述符集:
void FD_SET(intfd,fd_set *fdset);
将文件描述符集fdset中的fd清除:
void FD_CLR(intfd,fd_Set *fdset);
清空文件描述符集fdset:
voidFD_ZERO(fd_Set *fdset);
检测文件描述符集fdset中的fd是否发生变化:
void FD_ISSET(intfd,fd_set *fdset);
Poll相关知识
unsigned int(*poll)(struct file *filp,poll_table *wait);
使用poll_wait将等待队列添加到poll_table中;返回描述符是否可读或可写的掩码。(POLLIN设备可读,POLLRDNORM数据可读,POLLOUT设备可写,POLLWRNORM数据可写。设备可读通常返回POLLIN|POLLRDNORM,设备可写通常返回POLLOUT|POLLWRNORM)。
自动创建设备文件
驱动程序初始化代码中调用class_create为该设备创建一个class,在为每个设备调用device_create创建对应的设备。
实例:
struct class*myclass = class_create(THIS_MODULE,”my_device_drive”);
device_create(myclass,NULL,MKDEV(major_num,0),NULL,”my_device”);
当驱动被加载时,udev就会被自动在/dev下创建my_device设备文件。