共两篇文章:还可以参考linux那些事linx_sysfs
========================================================================================
#include <linux/fs.h>
#include <linux/path.h>
#include <linux/dcache.h>
#include <linux/fdtable.h>
file_dentry->d_inode->i_uid
================================================================================
首先分析一下sys_read系统调用(内核版本为2.6.19.4)。
源代码如下(摘自fs/read_write.c)
-
SYSCALL_DEFINE3(read, unsigned int, fd, char __user *, buf, size_t, count)
-
{
-
struct file *file;
-
ssize_t ret = -EBADF;
-
int fput_needed;
-
file = fget_light(fd, &fput_needed);
-
if (file) {
-
loff_t pos = file_pos_read(file);
-
ret = vfs_read(file, buf, count, &pos);
-
file_pos_write(file, pos);
-
fput_light(file, fput_needed);
-
}
-
return ret;
-
}
这里用到了fget_light(),file_pos_read(),vfs_read(),file_pos_write(),fput_light()。
-
file_pos_read()和file_pos_write()(均位于fs/read_write.c)用来读取当前文件指针(即当前文件操作的位置)
-
fget_light()和fput_light()(位于fs/file_table.c和include/linux/file.h)必须是成对出现的!fget_light在当前进程的structfiles_struct中根据所谓的用户空间文件描述符fd来获取文件描述符。另外,根据当前fs_struct是否被多各进程共享来判断是否需要对文件描述符进行加锁,并将加锁结果存到一个int中返回, fput_light则根据该结果来判断是否需要对文件描述符解锁
-
vfs_read()(位于fs/read_write.c)调用具体文件系统的read函数来完成读操作,代码如下:
-
ssize_t vfs_read(struct file *file, char __user *buf, size_t count, loff_t *pos)
-
{
-
ssize_t ret;
-
if (!(file->f_mode & FMODE_READ))
-
return -EBADF;
-
if (!file->f_op || (!file->f_op->read && !file->f_op->aio_read))
-
return -EINVAL;
-
if (unlikely(!access_ok(VERIFY_WRITE, buf, count)))
-
return -EFAULT;
-
ret = rw_verify_area(READ, file, pos, count);
-
if (ret >= 0) {
-
count = ret;
-
if (file->f_op->read)
-
ret = file->f_op->read(file, buf, count, pos);
-
else
-
ret = do_sync_read(file, buf, count, pos);
-
if (ret > 0) {
-
fsnotify_access(file->f_path.dentry);
-
add_rchar(current, ret);
-
}
-
inc_syscr(current);
-
}
-
return ret;
-
}
通过源码可以看出,内核中无法直接使用sys_read()来进行文件操作,因为sys_read()总会在当前进程的structfiles_struct中查找文件。
(除非内核想对当前进程打开的某个文件进行操作,不知道这种情况是否存在)
内核可以使用vfs_read()来进行文件操作,一个例子如下
-
ssize_t nread;
-
loff_t pos;
-
mm_segment_t old_fs;
-
struct file *file=NULL;
-
old_fs = get_fs();
-
set_fs(KERNEL_DS);
-
file = filp_open("filename", O_RDONLY, 0);
-
if(IS_ERR(file))
-
{
-
printk(KERN_INFO"filp open error/n");
-
set_fs(old_fs);
-
return -1;
-
}
-
else
-
printk(KERN_INFO"filp open succeeded/n");
-
pos=0;
-
nread = vfs_read(file, (char __user *)buffer, len, &pos);
-
if(nread < 0)
-
printk(KERN_INFO"vfs_read failed!/n");
-
else if(nread < len)
-
printk(KERN_INFO"vfs_read PART data/n");
-
else
-
printk(KERN_INFO"vfs_read succeeded/n");
-
if(file)filp_close(file, NULL);
-
-
set_fs(old_fs);
主要区别就是在操作前调用set_fs()(位于arch/x86/boot/boot.h)将当前fs段寄存器设为KERNEL_DS,在完成后再调用该函数将fs段寄存器设为原来的值,这样做的原因尚不明,希望高手指点。
问题:
1.内核中atomic_read()加锁是怎么进行的
2.还可调用kernel_read()(位于fs/exec.c,在include/linux/fs.h中声明)来直接读文件,该函数中完成了fs段期存期的保存,但找不到对应的kernel_write()函数
===================================================================================
有时候需要在Linux kernel--大多是在需要调试的驱动程序--中读写文件数据。在kernel中操作文件没有标准库可用,需要利用kernel的一些函数,这些函数主要有: filp_open() filp_close(), vfs_read() vfs_write(),set_fs(),get_fs()等,这些函数在linux/fs.h和asm/uaccess.h头文件中声明。下面介绍主要步骤
1. 打开文件
filp_open()在kernel中可以打开文件,其原形如下:
strcut file* filp_open(const char* filename, int open_mode, int mode);
该函数返回strcut file*结构指针,供后继函数操作使用,该返回值用IS_ERR()来检验其有效性。
参数说明
filename: 表明要打开或创建文件的名称(包括路径部分)。在内核中打开的文件时需要注意打开的时机,很容易出现需要打开文件的驱动很早就加载并打开文件,但需要打开的文件所在设备还不有挂载到文件系统中,而导致打开失败。
open_mode: 文件的打开方式,其取值与标准库中的open相应参数类似,可以取O_CREAT,O_RDWR,O_RDONLY等。
mode: 创建文件时使用,设置创建文件的读写权限,其它情况可以匆略设为0
2. 读写文件
kernel中文件的读写操作可以使用vfs_read()和vfs_write,在使用这两个函数前需要说明一下get_fs()和 set_fs()这两个函数。
vfs_read() vfs_write()两函数的原形如下:
ssize_t vfs_read(struct file* filp, char __user* buffer, size_t len, loff_t* pos);
ssize_t vfs_write(struct file* filp, const char __user* buffer, size_t len, loff_t* pos);
注意这两个函数的第二个参数buffer,前面都有__user修饰符,这就要求这两个buffer指针都应该指向用空的内存,如果对该参数传递kernel空间的指针,这两个函数都会返回失败-EFAULT。但在Kernel中,我们一般不容易生成用户空间的指针,或者不方便独立使用用户空间内存。要使这两个读写函数使用kernel空间的buffer指针也能正确工作,需要使用set_fs()函数或宏(set_fs()可能是宏定义),如果为函数,其原形如下:
void set_fs(mm_segment_t fs);
该函数的作用是改变kernel对内存地址检查的处理方式,其实该函数的参数fs只有两个取值:USER_DS,KERNEL_DS,分别代表用户空间和内核空间,默认情况下,kernel取值为USER_DS,即对用户空间地址检查并做变换。那么要在这种对内存地址做检查变换的函数中使用内核空间地址,就需要使用set_fs(KERNEL_DS)进行设置。get_fs()一般也可能是宏定义,它的作用是取得当前的设置,这两个函数的一般用法为:
mm_segment_t old_fs;
old_fs = get_fs();
set_fs(KERNEL_DS);
...... //与内存有关的操作
set_fs(old_fs);
还有一些其它的内核函数也有用__user修饰的参数,在kernel中需要用kernel空间的内存代替时,都可以使用类似办法。
使用vfs_read()和vfs_write()最后需要注意的一点是最后的参数loff_t * pos,pos所指向的值要初始化,表明从文件的什么地方开始读写。
3. 关闭读写文件
int filp_close(struct file*filp, fl_owner_t id);
该函数的使用很简单,第二个参数一般传递NULL值,也有用current->files作为实参的。
使用以上函数的其它注意点:
1. 其实Linux Kernel组成员不赞成在kernel中独立的读写文件(这样做可能会影响到策略和安全问题),对内核需要的文件内容,最好由应用层配合完成。
2. 在可加载的kernel module中使用这种方式读写文件可能使模块加载失败,原因是内核可能没有EXPORT你所需要的所有这些函数。
3. 分析以上某些函数的参数可以看出,这些函数的正确运行需要依赖于进程环境,因此,有些函数不能在中断的handle或Kernel中不属于任可进程的代码中执行,否则可能出现崩溃,要避免这种情况发生,可以在kernel中创建内核线程,将这些函数放在线程环境下执行(创建内核线程的方式请参数kernel_thread()函数)。