Linux编程入门(4)-改变文件的读写位置

当对某个文件进行操作时,我们可以指定文件的读/写位置吗?答案是:当然可以。让我们一起来学习下,如何设置文件的操作位置。

文件读写位置

Linux系统每次打开一个文件,内核会用一个指针来记录该文件的偏移量,有时也称为读写偏移量指针文件偏移量是指执行下一个 read() 或者 write() 操作的文件起始位置,通常是非负整数,用以度量从文件开始处计算的字节数。文件内第一个字节的偏移量为 0。

文件打开时,文件偏移量的值设置为指向文件的开头。以后每次读或者写将自动对其进行调整,以指向已读或已写数据的下一个字节。

当从文件读取数据时,内核从指针所表明的地方开始读取指定的字节,然后移动指针,指向下一个未被读取的字节。向文件写入数据的操作类似。

指针是与文件描述符相关联的,而不是与文件关联的。如果两个程序同时打开一个文件,这时会有两个指针,两个程序对文件的读操作不会互相干扰。

系统调用

系统函数 lseek() 可以改变已经打开文件的当前读写位置。其函数原型如下

#include <sys/types.h>
#include <unistd.h>

off_t lseek(int fd, off_t offset, int whence);

针对文件描述符 fd 所指代的已打开文件,系统调用 lseek() 依照 offsetwhence 参数值调整该文件的偏移量。

参数 fd,已打开文件的描述符。

参数 offset,指定了一个以字节为单位的数值。

参数 whence,表明应该参照哪个基点来解释 offset 参数,应为下列其中之一:

SEEK_SET

​ 将文件的偏移量设置为距**文件开始**处的 offset 个字节,其值必须为非负数。

SEEK_CUR

​ 将该文件的偏移量设置为距离当前位置处的 offset 个字节,即当前偏移量加 offset(可为正或负)。

SEEK_END

​ 将该文件的偏移量设置为距离文件结尾处的 offset 个字节,即文件偏移量设置为文件长度加 offset(可为正或负)。

lseek() 返回值 ,调用成功,会返回新的文件偏移量;调用失败,返回 -1。

通常,文件偏移量应当是一个非负整数。但是,某些设备也可能允许负的偏移量。对于普通文件,其偏移量必须是非负值。由于偏移量可能为负值,所以在判断 lseek 的返回值时,要测试它是否等于 -1,而不要测试它是否小于 0。

系统调用 lseek() ,只是调整内核中与文件描述符相关的文件偏移量记录,并没有引起任何 I/O 操作,即没有对任何物理设备进行访问。

lseek() 并不适用于所有类型的文件。例如,不允许将 lseek() 应用于管道、 FIFO、 socket 或者终端等。一旦如此, 调用将会失败。

文件空洞

如果文件偏移超过文件结尾,可以吗?再执行 I/O 操作会出现什么现象?

文件的偏移量可以超出文件结尾。这种情况下,执行 read() 调用将返回 0,表示已经到达文件结尾。执行 write() 函数却可以在文件结尾之后的任意位置写入数据。新写入数据的文件位置与文件结尾之间的空间,会构成一个空洞,即文件空洞。从编程的角度来看,文件空洞是存在字节的,读取空洞将返回 0(空字节)

文件的空洞不占用任何磁盘空间。如果在文件空洞中写入了数据,文件系统才会为之分配磁盘块。带空洞的文件叫做稀疏文件。其优势在于,与为实际需要的空字节分配磁盘相比,稀疏填充的文件会占用较少的磁盘空间。

空洞的存在,意味着一个文件名义上的大小可能要比其占用的磁盘存储总量要大(有时会大出许多)。向文件空洞中写入字节,内核需要为其分配存储单元,即使文件大小不变,系统的可用磁盘空间也将减少。

示例代码

让我们来写一段代码,来进行实验,调整文件偏移量,产生空洞文件。代码如下

#include <fcntl.h>
#include <sys/types.h>
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>

char buf1[] = "abcdefghijk";
char buf2[] = "ABCDEFGHIJK";

int main(void)
{
	int fd;

	/* 创建新文件 */
	if((fd = creat("file.hole", 0660)) < 0)
	{
		perror("creat error");
	}

	/* 向文件写入缓冲区buf1数据 */
	if(write(fd, buf1, 11) != 11)
	{
		perror("buf1 write error");
	}

	/* 以当前偏移量为基点,向后调整文件偏移量 */
	if(lseek(fd, 16384, SEEK_SET) == -1)
	{
		perror("lseek error");
	}

	/* 在新的偏移量位置写入缓冲区buf2数据 */
	if(write(fd, buf2, 11) != 11)
	{
		perror("buf2 write error");
	}

	exit(0);
}

编译、运行后的结果如下:

$ gcc lseek.c -o lseek1

$ ./lseek1 

$ ls -l file.hole  /* 查看文件大小 */
-rw-rw---- 1 user user 16395 11月  9 23:13 file.hole

$ od -c file.hole  /* 查看实际内容 */
0000000   a   b   c   d   e   f   g   h   i   j   k  \0  \0  \0  \0  \0
0000020  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0  \0
*
0040000   A   B   C   D   E   F   G   H   I   J   K
0040013

使用 od 命令查看该文件的实际内容。命令中的 -c 选项表示以字符方式打印文件内容。从中可以看到,文件中间的 21 个未写入字节都被读成 0。每一行开始的 7 位数是以八进制形式表示的字节偏移量。

总结

经过本篇文章,学习了文件偏移相关内容,以及如何显示地调整文件偏移量。

至此,文件 I/O 基本的系统函数全部学习完毕。包括:

open、close、read、write、lseek。

OK,接下来,我们继续其他内容的学习。

——————————————————————————————
关注公众号【一起学习嵌入式】,一起学习,一起成长

  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zsky_01

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值