文件IO
思考:
数据以什么样的方式存放在电脑中?
二进制!
在带有操作系统的计算机中数据操作是以什么为单位?
都是以文件的形式!
文件?:在存储介质上数据的集合就是文件 存储介质是硬盘(外存)
内存是用来执行指令或者计算的!
Linux的文件IO:
Linux提供了两种文件IO的方式:
第一种:是带缓冲区的IO,第二种是不带缓冲区的IO,
分别称之为标准IO和系统IO
1、标准IO
缓冲的作用就是尽可能的减少read write 的次数!
如果打开一个文件,没有缓冲是不是要实时写入!
标准IO提供三种缓冲结构:
1、全缓冲结构:就是整个缓冲满了才会执行写入!一般比较少见
2、行缓冲结构:就是一行写满了或者遇到'\n'就会写入到文件中!
ex:printf scanf 就是典型的行缓冲结构!
3、不带缓冲:直接IO操作 系统IO中!
//ex:putchar()
概念:标准IO中,其操作的核心对象就是流(strem),当使用标准IO
打开一个文件时,就会创建一个名为FILE结构体的指针,这个指针就是
所谓的文件流。
可以这样认为,光标就是文件流!
操作系统一般会自动打开以下三个文件流:
stdin 标准输入 文件流
stdout 标准输出文件流
stderr 标准出错文件流
文件指针:
回忆 什么是数组指针?
其本质是一个指针,指向一个数组!
文件指针:实质是一个指针,指向一个文件!
如何定义文件指针:使用FILE结构体定义即可!
定义指针的方式: 基类型 *指针名;
文件指针同样这样定义,只是基类型为FILE。
标准IO 文件的操作步骤:
打开 - 操作(read\write)-关闭!
1、打开关闭流:
函数 使用fopen打开一个文件:
函数原型:FILE *fopen(const char *path, const char *mode);
功能:打开一个文件
参数: path:带路径的文件名 此处的路径是相对路径!
相对路径:从当前目录开始
绝对路径:从根目录开始的
ex: ./1.txt 相对路径
/1.txt 绝对路径 /就是根目录!
mode 文件使用的方式: 以下列顺序之一开始
r 以只读的方式打开文件 如果文件不存在就报错
w 以只写的方式打开文件 如果文件不存在就创建文件,如果存在就清空文件(注意这里的读写如果是文件还没有关闭的话,连续读写是以追加方式读写的,而不是重头开始写;)
+ 增强功能
r+ 表示可读可写的方式,文件不存在就报错
w+ 表示可读可写的方式,文件不存在则创建文件,存在则清空文件!
a 以追加方式打开文件 在文件末尾添加数据,如果文件不存在就创建文件
a+ 与a 相似 可读可写。
返回值:返回一个文件指针,失败返回NULL,错误存放在errno中!
errno: 是一个操作系统提供的全局变量,当有一个进程或者系统函数执行出错时就将错误号保存在其中
然后供其他进程查看处理!
函数:fclose关闭一个文件:
原型:int fclose(FILE *fp);
参数: 文件指针 就是fopen的返回值!
返回值:成功返回0 失败返回EOF(-1);
2、文件读写流:
2.1 每次读写一个字符
int fgetc(FILE *stream);
int getc(FILE *stream);
int getchar(void);
参数:stream 文件流 即文件指针 也就是 fopen函数的返回值!
前两个函数是从其参数指定的文件中读取一个字符的数据,并返回该字符的ASCII码值!
getchar 函数是从标准输入中获取一个字符并返回该字符的ASCII值! 标准输入 指的是键盘
成功返回读取字符的ASCII码值,失败返回-1;
#include <stdio.h>
int fputc(int c, FILE *stream);
int putc(int c, FILE *stream);
int putchar(int c);
参数: c你要写的字符的ASCII码
stream : 文件流即文件指针,fopen的返回值!
前两个函数的功能是将表示字符的c 写入到stream指向的文件中。
putchar 的功能是将字符c写入到标准输出! 标准输出:指屏幕或者终端!
成功返回写入字符的ASCII,失败返回-1;
练习:实现cp 功能!
注意使用main传参!
main(int argc ,char* argv)
argc main函数的参数格式
argv 字符串数组!
2.2 按行读写文件流
写入:
#include <stdio.h>
int fputs(const char *s, FILE *stream);
功能: 将所指的字符串写入到文件流stream中!
int puts(const char *s);
功能:将指针s所指的字符串写入到标准输出!
返回值:成功返回成功写入的字符个数,失败返回-1,错误被存放于errno!
读取:
#include <stdio.h>
char *fgets(char *s, int size, FILE *stream);
功能:从文件流stream 中读取size 个的字符到s所指的内存中!
char *gets(char *s);
功能:从标准输入获取字符串到s所指的内存中。
fgets 一般有以下三种情况之一时会结束:
1、文件读完了!
2、遇到一个'\n'换行符
3、读取了size-1个字节的数据!
问题:为什么是size-1个不是size个?
后面要加'\0';
返回值:成功返回存储的首地址,失败返回NULL!
将上一个练习题使用 行处理完成。
思考题:之前使用gets时有一个致命的缺陷:就是不会检查越界问题,编译器建议
使用fgets,那如何使用fgets代替gets!
//fgets(char *s,int size,stdin);
char s[10] = {0};
gets(s);
=>
char s[10] = {0};
fgets(s,10,stdin);
2.3直接读写流:
读取:
fread函数:
#include <stdio.h>
size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);
功能:从stream这个文件流中,读取单位为size个字节的nmemb个字符到ptr所指的内存中!
(从文件中读取 单位为size个字节、个数为nmemb个单位的数据到ptr中!)
参数: ptr 存储读取到字符的位置首地址!
size:每个元素的大小
nmemb: 读取元素的个数
stream :文件流 fopen的返回值!
返回值::成功返回读取到的字符个数
失败返回-1
size_t fwrite(const void *ptr, size_t size, size_t nmemb,
FILE *stream);
功能:将ptr所指内存区域的 单位为size 数量为nmemb个单位的 数据写入到文件流中!
将CP指令使用以上两个函数实现!自己做,我就不讲了!
2.4 定位流
#include <stdio.h>
int fseek(FILE *stream, long offset, int whence);
参数 :
stream :文件流 fopen的返回值!
offset :偏移量
whence: 从哪里开始偏移:
SEEK_SET: 从文件头开始 此时 offset只能为正数 不能为负数!
SEEK_END: 从文件末尾开始偏移
SEEK_CUR: 从光标当前位置开始偏移
功能:从某个位置开始偏移光标offset个字节!
返回值:成功返回0,失败返回-1;
注意 offset是偏移量,可正可负,当为正时向后偏移,当为负时向前偏移:
一般而言以追加方式打开文件其读文件流位于文件头,写文件流位于文件末尾!
long ftell(FILE *stream);
功能:求当前光标位置距离文件头有多少个字节!
写一个程序 如何计算文件大小!
打开文件
光标偏移到文件末尾
然后读取距离文件头的位置
接收返回值并打印!
fseek(fd,0,SEEK_END);
long size = ftell(fd);
printf(.....);
注意9个字母求size是10,因为有\0,strlen不会测\0但是9个字母可能是10或者11,windows下可能是\n\t;linux虚拟机下是\n;(但是一般笔试题里面的strlen是9)
void rewind(FILE *stream);
功能:使光标回到文件头!
测试:
fseek(fd,0,SEEK_END);
long size = ftell(fd);
printf(.....);
rewind(fd);
printf("%d \n",ftell(fd));一定等于0!
2.5 格式化IO流
格式化输出:
int printf(const char *format, ...);
将字符串format格式化输出到标准输出
int sprintf(char *str, const char *format, ...);
将字符串format 格式化输出到str所指的内存空间中!
int snprintf(char *str, size_t size, const char *format, ...);
将字符串format中的size个字节的数据格式化输出到str中!
int fprintf(FILE *stream, const char *format, ...);
将字符串格式化输出到文件流中!
格式化输入:
int scanf(const char *format, ...);
从标准输入格式化输入一个字符串!
int fscanf(FILE *stream, const char *format, ...);
从文件流中格式化输入一个字符串;
int sscanf(const char *str, const char *format, ...);
从str所指的内存中格式化输入一个字符串!
使用方法同 printf;
思考:如何使用fprintf 代替printf;fprintf(stdout,...);
如何使用fscanf 代替scanf;fscanf(stdin,...);
2、数据在硬盘当中的存储:
1、物理上:硬盘的最小存储单位是什么?扇区
一般情况下一个扇区的大小是128*2^n个字节!
一般一个扇区就是512btye 字节!最新的硬盘是4K;
2、系统层次:文件系统和vfs存储数据的最小单元 就是块 block;
在linux下使用指令 df -T 查看文件系统的类型
getconf PAGESIZE 查看块大小 一般块大小为4K
块的大小可以有系统更改使用 mkfs指令来修改!
3、inode 节点:
在文件系统层次上,文件是存储在块上的,需要采用一种机制来记录文件存储在哪一个块上,这个标记方式就i节点,
一般的一个文件就对应一个i节点。
inode 节点具有以下几个信息: 其本身对应一个结构体,保存文件的大小、创建的日期、修改的日期、块信息。
获取文件属性就是获取i节点信息。
3、在linux中,使用文件描述符代表打开的一个文件,所谓的文件描述符就是进程中文件表项的每个成员的下标,
其本质就是一个非负数,一个文件描述符就对应着打开的一个文件。
什么是文件表项?其实就是文件描述符的表,是一个矢量也就是数组,文件描述符就是数组的下标,而元素就是文件指针。
在文件表项中,其中0-2已经被操作系统占用打开,分别为 标准输入、标准输出、标准出错文件流!
linux内核提供了三种数据结构表示打开的文件,分别是文件描述符表就是文件表项,文件表,v节点表,他们之间的关系
决定着文件共享方面一个进程对于另外一个进程可能产生的影响。
3.1 每个进程的进程表中都有一个文件表记录项,记录项中包含一张打开文件的描述符表,每个描述符占用一栏,
与每个文件相对应:具有两点信息:
1、文件描述符标志:就是文件指针的下标
2、文件指针即流!
3.2 内核为所有打开的文件都创建了一个文件表,每个文件表包含:
1、文件状态标志:就是打开的标志 读写 可读可写
2、文件偏移量
3、指向该文件V节点的指针
3.3 每个打开的文件或者设备都有一个V节点表,v节点包括了文件类型和对该文件操作的函数指针,
V节点还包括了从硬盘中读取i节点的信息,至于节点信息已经讲过了!
最后 文件表以及V节点每个进程打开一次就对应创建一个但是i节点一个文件就严格对应一个!