file结构体、inode结构体和dentry结构体
内核使用三种数据结构表示打开的文件:
(1)每个进程在进程表中都有一个记录项,记录项包含一张打开的文件描述符表,可将视为矢量,每个描述符占用一项,与每个文件描述符相关联的是:a)文件描述符标志(close_on_exec)
b))指向一个文件表项的指针
(2)内核为所有打开文件维持一张文件表,每个文件表项包含:
a)文件状态标志(读写等等)
b)当前文件偏移量
c)指向该文件V节点表项的指针
(3)每个打开文件(或设备)都有一个V-node结构。v节点包含了文件类型和对此文件进行各种操作的函数指针。对于大多数文件V节点还包含文件的i节
点(索引节点)。这些信息是在打开文件时从磁盘上读入内存的。对于linux没有V节点。
1、file结构体
struct file结构体定义在include/linux/fs.h中定义。文件结构体代表一个打开的文件,系统中的每个打开的文件在内核空间都有一个关联的 struct file。
它由内核在打开文件时创建,并传递给在文件上进行操作的任何函数。在文件的所有实例都关闭后,内核释放这个数据结构。在内核创建和驱动源码中,
struct file的指针通常被命名为file或filp。如下所示:
struct file {
union {
struct list_head fu_list; 文件对象链表指针linux/include/linux/list.h
struct rcu_head fu_rcuhead; RCU(Read-Copy Update)是Linux 2.6内核中新的锁机制
} f_u;
struct path f_path; 包含dentry和mnt两个成员,用于确定文件路径
#define f_dentry f_path.dentry f_path的成员之一,当前文件的dentry结构
#define f_vfsmnt f_path.mnt 表示当前文件所在文件系统的挂载根目录
const struct file_operations *f_op; 与该文件相关联的操作函数
atomic_t f_count; 文件的引用计数(有多少进程打开该文件)
unsigned int f_flags; 对应于open时指定的flag
mode_t f_mode; 读写模式:open的mod_t mode参数
off_t f_pos; 该文件在当前进程中的文件偏移量
struct fown_struct f_owner; 该结构的作用是通过信号进行I/O时间通知的数据。
unsigned int f_uid, f_gid; 文件所有者id,所有者组id
struct file_ra_state f_ra; 在linux/include/linux/fs.h中定义,文件预读相关
unsigned long f_version;
#ifdef CONFIG_SECURITY
void *f_security;
#endif
/* needed for tty driver, and maybe others */
void *private_data;
#ifdef CONFIG_EPOLL
/* Used by fs/eventpoll.c to link all the hooks to this file */
struct list_head f_ep_links;
spinlock_t f_ep_lock;
#endif /* #ifdef CONFIG_EPOLL */
struct address_space *f_mapping;
};
2、inode结构体
内核中用inode结构表示具体的文件。
struct inode {
struct hlist_node i_hash; 哈希表
struct list_head i_list; 索引节点链表
struct list_head i_sb_list;
struct list_head i_dentry; 目录项链表
unsigned long i_ino; 节点号
atomic_t i_count; 引用记数
unsigned int i_nlink; 硬链接数
uid_t i_uid; 使用者id
gid_t i_gid; 使用者id组
dev_t i_rdev; //该成员表示设备文件的inode结构,它包含了真正的设备编号。实设备标识符
u64 i_version;
loff_t i_size; 以字节为单位的文件大小
#ifdef __NEED_I_SIZE_ORDERED
seqcount_t i_size_seqcount;
#endif
struct timespec i_atime; 最后访问时间
struct timespec i_mtime; 最后修改(modify)时间
struct timespec i_ctime; 最后改变(change)时间
unsigned int i_blkbits; 以位为单位的块大小
blkcnt_t i_blocks; 文件的块数
unsigned short i_bytes; 文件的字节数
umode_t i_mode; 访问权限控制
spinlock_t i_lock; /* i_blocks, i_bytes, maybe i_size */自旋锁
struct mutex i_mutex;
struct rw_semaphore i_alloc_sem;
const struct inode_operations *i_op;
const struct file_operations *i_fop; <span style="white-space:pre"> </span>/* former ->i_op->default_file_ops */
struct super_block *i_sb;
struct file_lock *i_flock;
struct address_space *i_mapping;
struct address_space i_data;
#ifdef CONFIG_QUOTA
struct dquot *i_dquot[MAXQUOTAS];
#endif
struct list_head i_devices;
union {
struct pipe_inode_info *i_pipe;
struct block_device *i_bdev;
struct cdev *i_cdev; <span style="white-space:pre"> </span>//该成员表示字符设备的内核的内部结构。当inode指向一个字符设备文件时,该成员包含了指向struct cdev结<span style="white-space:pre"> </span>//构的指针,其中cdev结构是字符设备结构体。
};
int <span style="white-space:pre"> </span>i_cindex;
__u32 <span style="white-space:pre"> </span>i_generation;
#ifdef CONFIG_DNOTIFY
unsigned long i_dnotify_mask; /* Directory notify events */
struct dnotify_struct *i_dnotify; /* for directory notifications */
#endif
#ifdef CONFIG_INOTIFY
struct list_head inotify_watches; /* watches on this inode */
struct mutex inotify_mutex; /* protects the watches list */
#endif
unsigned long i_state;
unsigned long dirtied_when; /* jiffies of first dirtying */
unsigned int i_flags;
atomic_t i_writecount;
#ifdef CONFIG_SECURITY
void *i_security;
#endif
void *i_private; /* fs or device private pointer */
};
inode 译成中文就是索引节点。每个存储设备或存储设备的分区(存储设备是硬盘、软盘、U盘 ... ... )被格式化为文件系统后,应该有两部份,一部份是inode,另一部份是Block,Block是用来存储数据用的。而inode呢,就是用来存储这些数据的信息,这些信息包括文件大小、属主、归属的用户组、读写权限等。inode为每个文件进行信息索引,所以就有了inode的数值。操作系统根据指令,能通过inode值最快的找到相对应的文件。
做个比喻,比如一本书,存储设备或分区就相当于这本书,Block相当于书中的每一页,inode 就相当于这本书前面的目录,一本书有很多的内容,如果想查找某部份的内容,我们可以先查目录,通过目录能最快的找到我们想要看的内容。
当我们用ls 查看某个目录或文件时,如果加上-i 参数,就可以看到inode节点了;比如ls -li lsfile.sh ,最前面的数值就是inode信息
3、struct dentry结构体
dentry 的中文名称是目录项,是Linux文件系统中某个索引节点(inode)的链接。这个索引节点可以是文件,也可以是目录。inode(可理解为ext2 inode)对应于物理磁盘上的具体对象,dentry是一个内存实体,其中的d_inode成员指向对应的inode。也就是说,一个inode可以在运行的时候链接多个dentry,而d_count记录了这个链接的数量。
struct dentry {
atomic_t d_count; 目录项对象使用计数器,可以有未使用态,使用态和负状态
unsigned int d_flags; 目录项标志
struct inode * d_inode; 与文件名关联的索引节点
struct dentry * d_parent; 父目录的目录项对象
struct list_head d_hash; 散列表表项的指针
struct list_head d_lru; 未使用链表的指针
struct list_head d_child; 父目录中目录项对象的链表的指针
struct list_head d_subdirs; 对目录而言,表示子目录目录项对象的链表
struct list_head d_alias; 相关索引节点(别名)的链表
int d_mounted; 对于安装点而言,表示被安装文件系统根项
struct qstr d_name; 文件名
unsigned long d_time; /* used by d_revalidate */
struct dentry_operations *d_op; 目录项方法
struct super_block * d_sb; 文件的超级块对象
vunsigned long d_vfs_flags;
void * d_fsdata; 与文件系统相关的数据
unsigned char d_iname [DNAME_INLINE_LEN]; 存放短文件名
};
当访问文件时,首先open("",??), open函数通过系统调用sys_open进入内核空间, sys_open又调用do_sys_open,
do_sys_open 通过get_unused_fd(),在当前进程空间内的struct file结构数组中,
找一个空的struct file{}结构,并返回一个数组的下标号,之后do_sys_open又调用do_filp_open,do_filp_open调用nameidata_to_filp,
nameidata_to_filp调用__dentry_open,在__dentry_open,通过关键语句,f->f_op = fops_get(inode->i_fop);
得到了具有一个指向struct file_operations结构的指针的struct file结构指针,之后通过语句
if (!open && f->f_op)
open = f->f_op->open;
if (open) {
error = open(inode, f);
if (error)
goto cleanup_all;
}
调用我们编写的struct file_operations中的xxx_open()
其他操作类似,
read调用顺序如下:
read()->sys_read()->vfs_read()->{file->f_op->read}
用户空间的read、write---linux系统调用---间接调用设备驱动程序中file_operations结构中的函数整个调用过程是这样一个顺序的。
/proc/modules, /proc/devices, /dev
/proc/modules : 模块加载列表,insmod(加载模块)后在此添加一行
/sys/module : 添加一目录,insmod(加载模块)后在此添加一子目录
/proc/devices : 注册设备列表,注册设备(register_chrdev_region,alloc_chrdev_region)后在此添加一行。--- 一般在模块加载时可以注册设备。
int register_chrdev_region(dev_t first, unsigned int count, char *name); name是设备的名字; 它会出现在 /proc/devices 和 sysfs 中。
如果用alloc_chrdev_region,因为动态分配,所以还需要读取/proc/devices文件以获得Linux内核分配给该设备的主设备号。
/dev/* : 设备节点,mknod(创建设备节点)后在此添加一子目录。
如mknod /dev/ttyS0 c 4 64,用户通过此设备名来访问你的驱动。使用上面得到的主设备号。
mknod Name { b | c } Major Minor
(1)加载模块可能注册设备,也可能不注册设备;
(2)注册的设备(即设备驱动程序)可以对应多个设备;
(3)“加载模块的名字”可以和“注册的设备的名字”没有任何关联;只依赖于动态模块中注册设备时传入的参数name。
(4)而且/proc/devices和/dev下的名字也可以完全不同,只依赖于“主设备号”关联二者的关系;
(5)/dev下还有其他设备;
cat /proc/modules
nfs 228929 13 - Live 0xf929e000 -------- 模块名,占用内存,加载次数,是否可用,起始地址?
lockd 61257 2 nfs, Live 0xf91c8000
fscache 20321 1 nfs, Live 0xf8cf9000
nfs_acl 7617 1 nfs, Live 0xf8a6b000
查看主设备号cat /proc/devices
Character devices:
1 mem
4 /dev/vc/0
4 tty
4 ttyS