文件IO

 

文件IO

 

思考:

数据以什么样的方式存放在电脑中?

二进制!

在带有操作系统的计算机中数据操作是以什么为单位?

都是以文件的形式!

文件?:在存储介质上数据的集合就是文件 存储介质是硬盘(外存)

内存是用来执行指令或者计算的!

 

Linux的文件IO:

Linux提供了两种文件IO的方式:

第一种:是带缓冲区的IO,第二种是不带缓冲区的IO,

分别称之为标准IO和系统IO

 

1、标准IO

缓冲的作用就是尽可能的减少read write 的次数!

如果打开一个文件,没有缓冲是不是要实时写入!

标准IO提供三种缓冲结构:

1、全缓冲结构:就是整个缓冲满了才会执行写入!一般比较少见

2、行缓冲结构:就是一行写满了或者遇到'\n'就会写入到文件中!

ex:printf scanf 就是典型的行缓冲结构!

3、不带缓冲:直接IO操作  系统IO中!

//ex:putchar()

 

概念:标准IO中,其操作的核心对象就是流(strem),当使用标准IO

打开一个文件时,就会创建一个名为FILE结构体的指针,这个指针就是

所谓的文件流。

可以这样认为,光标就是文件流!

操作系统一般会自动打开以下三个文件流:

stdin 标准输入 文件流

stdout 标准输出文件流

stderr 标准出错文件流

文件指针:

回忆 什么是数组指针?

其本质是一个指针,指向一个数组!

文件指针:实质是一个指针,指向一个文件!

如何定义文件指针:使用FILE结构体定义即可!

定义指针的方式: 基类型 *指针名;

文件指针同样这样定义,只是基类型为FILE。

标准IO 文件的操作步骤:

打开 - 操作(read\write)-关闭!

 

1、打开关闭流:

函数 使用fopen打开一个文件:

 

 函数原型:FILE *fopen(const char *path, const char *mode);

 功能:打开一个文件

 参数: path:带路径的文件名 此处的路径是相对路径!

相对路径:从当前目录开始

绝对路径:从根目录开始的

ex: ./1.txt 相对路径

/1.txt 绝对路径 /就是根目录!

mode 文件使用的方式: 以下列顺序之一开始

r 以只读的方式打开文件 如果文件不存在就报错

w 以只写的方式打开文件 如果文件不存在就创建文件,如果存在就清空文件(注意这里的读写如果是文件还没有关闭的话,连续读写是以追加方式读写的,而不是重头开始写;)

+ 增强功能

r+ 表示可读可写的方式,文件不存在就报错

w+ 表示可读可写的方式,文件不存在则创建文件,存在则清空文件!

a 以追加方式打开文件 在文件末尾添加数据,如果文件不存在就创建文件

a+ 与a 相似 可读可写。

返回值:返回一个文件指针,失败返回NULL,错误存放在errno中!

errno: 是一个操作系统提供的全局变量,当有一个进程或者系统函数执行出错时就将错误号保存在其中

然后供其他进程查看处理!

函数:fclose关闭一个文件:

 

原型:int fclose(FILE *fp);

参数: 文件指针 就是fopen的返回值!

返回值:成功返回0 失败返回EOF(-1);

2、文件读写流:

2.1 每次读写一个字符

int fgetc(FILE *stream);

int getc(FILE *stream);

int getchar(void);

参数:stream 文件流 即文件指针 也就是 fopen函数的返回值!

前两个函数是从其参数指定的文件中读取一个字符的数据,并返回该字符的ASCII码值!

getchar 函数是从标准输入中获取一个字符并返回该字符的ASCII值! 标准输入 指的是键盘

 

成功返回读取字符的ASCII码值,失败返回-1;

 #include <stdio.h>

 

   int fputc(int c, FILE *stream);

   int putc(int c, FILE *stream);

   int putchar(int c);

   

   参数: c你要写的字符的ASCII码

 stream : 文件流即文件指针,fopen的返回值!

前两个函数的功能是将表示字符的c 写入到stream指向的文件中。

putchar 的功能是将字符c写入到标准输出! 标准输出:指屏幕或者终端!

成功返回写入字符的ASCII,失败返回-1;

练习:实现cp 功能!

 注意使用main传参!

 main(int argc ,char* argv)

 argc main函数的参数格式

 argv 字符串数组!

2.2 按行读写文件流

写入:

#include <stdio.h>

int fputs(const char *s, FILE *stream);

功能: 将所指的字符串写入到文件流stream中!

int puts(const char *s);

功能:将指针s所指的字符串写入到标准输出!

返回值:成功返回成功写入的字符个数,失败返回-1,错误被存放于errno!

 

读取:

#include <stdio.h>

char *fgets(char *s, int size, FILE *stream);

功能:从文件流stream 中读取size 个的字符到s所指的内存中!

char *gets(char *s);

功能:从标准输入获取字符串到s所指的内存中。

 

fgets 一般有以下三种情况之一时会结束:

1、文件读完了!

2、遇到一个'\n'换行符

3、读取了size-1个字节的数据!

问题:为什么是size-1个不是size个?

后面要加'\0';

返回值:成功返回存储的首地址,失败返回NULL!

将上一个练习题使用 行处理完成。

思考题:之前使用gets时有一个致命的缺陷:就是不会检查越界问题,编译器建议

使用fgets,那如何使用fgets代替gets!

//fgets(char *s,int size,stdin);

 

char s[10] = {0};

gets(s);

=>

char s[10] = {0};

fgets(s,10,stdin);

2.3直接读写流:

读取:

fread函数:

#include <stdio.h>

size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

功能:从stream这个文件流中,读取单位为size个字节的nmemb个字符到ptr所指的内存中!

(从文件中读取 单位为size个字节、个数为nmemb个单位的数据到ptr中!)

参数: ptr 存储读取到字符的位置首地址!

size:每个元素的大小

nmemb: 读取元素的个数

stream :文件流 fopen的返回值!

返回值::成功返回读取到的字符个数

失败返回-1

 

size_t fwrite(const void *ptr, size_t size, size_t nmemb,

 FILE *stream);

功能:将ptr所指内存区域的 单位为size 数量为nmemb个单位的 数据写入到文件流中!

将CP指令使用以上两个函数实现!自己做,我就不讲了!

2.4 定位流

 #include <stdio.h>

 

       int fseek(FILE *stream, long offset, int whence);

参数 :

stream :文件流 fopen的返回值!

offset :偏移量

whence: 从哪里开始偏移:

SEEK_SET: 从文件头开始 此时 offset只能为正数 不能为负数!

SEEK_END: 从文件末尾开始偏移

SEEK_CUR:  从光标当前位置开始偏移

功能:从某个位置开始偏移光标offset个字节!

返回值:成功返回0,失败返回-1;

注意 offset是偏移量,可正可负,当为正时向后偏移,当为负时向前偏移:

 

一般而言以追加方式打开文件其读文件流位于文件头,写文件流位于文件末尾!

 

       long ftell(FILE *stream);

功能:求当前光标位置距离文件头有多少个字节!

写一个程序 如何计算文件大小!

打开文件

光标偏移到文件末尾

然后读取距离文件头的位置

接收返回值并打印!

fseek(fd,0,SEEK_END);

long size = ftell(fd);

printf(.....);

注意9个字母求size是10,因为有\0,strlen不会测\0但是9个字母可能是10或者11,windows下可能是\n\t;linux虚拟机下是\n;(但是一般笔试题里面的strlen是9)

 

       void rewind(FILE *stream);

   功能:使光标回到文件头!

   测试:

fseek(fd,0,SEEK_END);

long size = ftell(fd);

printf(.....);

rewind(fd);

printf("%d \n",ftell(fd));一定等于0!

       2.5 格式化IO流

格式化输出:

 

int printf(const char *format, ...);

将字符串format格式化输出到标准输出

 

int sprintf(char *str, const char *format, ...);

将字符串format 格式化输出到str所指的内存空间中!

int snprintf(char *str, size_t size, const char *format, ...);

将字符串format中的size个字节的数据格式化输出到str中!

 

int fprintf(FILE *stream, const char *format, ...);

将字符串格式化输出到文件流中!

 

格式化输入:

int scanf(const char *format, ...);

从标准输入格式化输入一个字符串!

       int fscanf(FILE *stream, const char *format, ...);

   从文件流中格式化输入一个字符串;

       int sscanf(const char *str, const char *format, ...);

   从str所指的内存中格式化输入一个字符串!

   使用方法同 printf;

   

   思考:如何使用fprintf 代替printf;fprintf(stdout,...);

 

如何使用fscanf 代替scanf;fscanf(stdin,...);

 

2、数据在硬盘当中的存储:

1、物理上:硬盘的最小存储单位是什么?扇区

一般情况下一个扇区的大小是128*2^n个字节!

一般一个扇区就是512btye 字节!最新的硬盘是4K;

2、系统层次:文件系统和vfs存储数据的最小单元 就是块 block;

在linux下使用指令 df -T 查看文件系统的类型

getconf PAGESIZE 查看块大小 一般块大小为4K

块的大小可以有系统更改使用 mkfs指令来修改!

3、inode 节点:

在文件系统层次上,文件是存储在块上的,需要采用一种机制来记录文件存储在哪一个块上,这个标记方式就i节点,

一般的一个文件就对应一个i节点。

inode 节点具有以下几个信息: 其本身对应一个结构体,保存文件的大小、创建的日期、修改的日期、块信息。

获取文件属性就是获取i节点信息。

3、在linux中,使用文件描述符代表打开的一个文件,所谓的文件描述符就是进程中文件表项的每个成员的下标,

其本质就是一个非负数,一个文件描述符就对应着打开的一个文件。

 

什么是文件表项?其实就是文件描述符的表,是一个矢量也就是数组,文件描述符就是数组的下标,而元素就是文件指针。

在文件表项中,其中0-2已经被操作系统占用打开,分别为 标准输入、标准输出、标准出错文件流!

linux内核提供了三种数据结构表示打开的文件,分别是文件描述符表就是文件表项,文件表,v节点表,他们之间的关系

决定着文件共享方面一个进程对于另外一个进程可能产生的影响。

 

3.1 每个进程的进程表中都有一个文件表记录项,记录项中包含一张打开文件的描述符表,每个描述符占用一栏,

与每个文件相对应:具有两点信息:

1、文件描述符标志:就是文件指针的下标

2、文件指针即流!

3.2 内核为所有打开的文件都创建了一个文件表,每个文件表包含:

1、文件状态标志:就是打开的标志 读写 可读可写

2、文件偏移量

3、指向该文件V节点的指针

3.3 每个打开的文件或者设备都有一个V节点表,v节点包括了文件类型和对该文件操作的函数指针,

V节点还包括了从硬盘中读取i节点的信息,至于节点信息已经讲过了!

 

最后 文件表以及V节点每个进程打开一次就对应创建一个但是i节点一个文件就严格对应一个!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值