Linux最新【Linux】基础IO —— 缓冲区深度剖析_linux io 缓冲区大小(3),Linux运维高级面试题及答案

先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前在阿里

深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年最新Linux运维全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上运维知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化的资料的朋友,可以点击这里获取!

  • 作者水平很有限,如果发现错误,可在评论区指正,感谢🙏
  • 🎉🎉欢迎持续关注!
    在这里插入图片描述

请添加图片描述

基础IO

请添加图片描述

一. 缓冲区

在这里插入图片描述

🌈缓冲区是什么

💦缓冲区 (buffer),它是内存空间的一部分。 也就是说,在内存空间中预留了一定的存储空间,这些存储空间用来缓冲输入或输出的数据,这部分预留的空间就叫做缓冲区,显然缓冲区是具有一定大小的

🌈为什么要引入缓冲器

高速设备与低速设备的不匹配(cpu运算是纳秒,内存是微秒,磁盘是毫秒甚至是秒相差1000倍),势必会让高速设备花时间等待低速设备,我们可以在这两者之间设立一个缓冲区

💥举个例子:(顺丰就是缓冲区)

在这里插入图片描述

  • 可以解除两者的制约关系,数据可以直接送往缓冲区,高速设备不用再等待低速设备,提高了计算机的效率
  • 可以减少数据的读写次数,如果每次数据只传输一点数据,就需要传送很多次,这样会浪费很多时间,因为开始读写与终止读写所需要的时间很长,如果将数据送往缓冲区,待缓冲区满后再进行传送会大大减少读写次数,这样就可以节省很多时间。例如:我们想将数据写入到磁盘中,不是立马将数据写到磁盘中,而是先输入缓冲区中,当缓冲区满了以后,再将数据写入到磁盘中,这样就可以减少磁盘的读写次数,不然磁盘很容易坏掉

总的来说:

🌈缓冲区的初步认识

⚡缓冲区刷新策略!(一般+特殊)

  • 立即刷新
  • 行刷新(行缓冲) \n
  • 满刷新(全缓冲)
  • 特殊情况:用户强制刷新(fflush)、进程退出(必须刷新)

一般而言 ,行缓冲的设备文件 —— 显示器
全缓冲的设备文件 —— 磁盘文件

💦所以的设备,永远都倾向于全缓冲!(倾向于,但不绝对) —— 缓冲区满了,才刷新 —— 需要更少次的IO操作 —— 也就是更少次的外设访问(1次IO vs 10次IO)—— 也就可以提高效率

🌈其他刷新策略是结合具体情况做的妥协!

  • 显示器:直接给用户看的,一方面要照顾效率,一方面要照顾用户的体验( 极端情况,可以自定义规则的)
  • 磁盘文件:用户不需要立马看见文件的内容,可以把缓冲区写满再输出,更加注重效率的考量

我们可能有疑问:1000个字节,刷一次是1000个字节,刷十次整体也是1000个字节,哪里效率高呢❓

  • 👍和外设进行沟通IO的时候,数据量的大小不是主要矛盾,和外设预备IO的过程才是最耗费时间

好比:别人找你借钱,每一次都来找你唠嗑大半天,分开十次,沟通的时间花的很久,而转账的时间就几秒钟,一次沟通直接把钱全转过去了,才是效率最高的

🌈解疑答惑

在这里插入图片描述

同样的一个程序,向显示器打印输出4行文本,向普通文件(磁盘上)打印的时候,变成了7行,说明上面测试,并不影响系统接口

  1. C的IO接口是打印了2次的
  2. 系统接口,只打印了一次

我们最后调用fork,上面的函数已经被执行完了,但不代表数据已经被刷新了

🥑缓冲区是谁提供的

🔥曾经“我们所谈的缓冲区”,绝对不是由OS提供的,如果是OS同一提供,那么我们上面的代码,表现应该是一样的,而不是C的IO接口打印两次,所以是C标准库提供并且维护的用户级缓冲区

fputs把不是直接把数据直接放进操作系统,而是加载进C标准库的缓冲区中,加载完后自己可以直接返回;如果直接调用的是write接口,则是直接写给OS,不经过缓冲区

在这里插入图片描述

  1. C语言提供的接口都是向显示器打印的,刷新策略都是行刷新,那么最后执行fork的时候 —— 一定是函数执行完了 && 数据已经被刷新了(因为都带\n),所以fork执行无意义
  2. 如你对应的程序进行了重定向 ——> 要向磁盘文件打印 ——> 隐形的刷新策略变成了全缓冲!—— > \n便没有意义了 ——> 函数一定执行完了,数据还没有刷新!! 在当前进程对应的C标准库中的缓冲区中!!

这缓冲区的部分数据是父进程的数据吗? 是的
fork之后,父子分流,父进程的数据发生写时拷贝给子进程,所以C标准库会打印两次

在这里插入图片描述

总结:

  • 重定向到文件导致:刷新策略改变(变成全缓冲)
  • 写时拷贝:父子进程各自刷新一次
🥑用户级缓冲区在哪里?

当我们用fflush强制刷新的时候

#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>

int main()
{
 	//C语言提供的
    printf("hello printf\n");
    fprintf(stdout, "hello fprintf\n");
    const char \*s = "hello fputs\n";
    fputs(s, stdout);

    //OS提供的
    const char \*ss = "hello write\n";
    write(1, ss, strlen(ss));
    
    //fork之前,强制刷新
    fflush(stdout);
    
    //最后调用fork的时候,上面的函数已经被执行完了
    fork();//创建子进程 
    return 0;
}

结果如下:

在这里插入图片描述

数据在fork之前,已经被fflush刷新了,缓冲区里没有数据了,也就不存在写时拷贝。

这里更夸张的是,fflush(stdout)只告诉了stdout就能知道缓冲区在哪里?

FILE \*fopen(const char \*path, const char \*mode);

  • C语言中,open打开文件,返回的是FILE * ,struct FILE结构体 — 内部封装了fd,还包含了该文件fd对应的语言层的缓冲区结构!(远在天边,近在眼前)

我们可以看看FILE结构体:

//在/usr/include/libio.h
struct \_IO\_FILE {
	 int _flags; /\* High-order word is \_IO\_MAGIC; rest is flags. \*/
	#define \_IO\_file\_flags \_flags
	 //缓冲区相关
	 /\* The following pointers correspond to the C++ streambuf protocol. \*/
	 /\* Note: Tk uses the \_IO\_read\_ptr and \_IO\_read\_end fields directly. \*/
	 char\* _IO_read_ptr; /\* Current read pointer \*/
	 char\* _IO_read_end; /\* End of get area. \*/
	 char\* _IO_read_base; /\* Start of putback+get area. \*/
	 char\* _IO_write_base; /\* Start of put area. \*/
     char\* _IO_write_ptr; /\* Current put pointer. \*/
  	char\* _IO_write_end; /\* End of put area. \*/
	 char\* _IO_buf_base; /\* Start of reserve area. \*/
	 char\* _IO_buf_end; /\* End of reserve area. \*/
	 /\* The following fields are used to support backing up and undo. \*/
	 char \*_IO_save_base; /\* Pointer to start of non-current get area. \*/
	 char \*_IO_backup_base; /\* Pointer to first valid character of backup area \*/
	 char \*_IO_save_end; /\* Pointer to end of non-current get area. \*/
	 struct \_IO\_marker \*_markers;
	 struct \_IO\_FILE \*_chain;
 	int _fileno; //封装的文件描述符
	#if 0
	 int _blksize;
	#else
	 int _flags2;
	#endif
 	_IO_off_t _old_offset; /\* This used to be \_offset but it's too small. \*/
	#define \_\_HAVE\_COLUMN /\* temporary \*/
	 /\* 1+column number of pbase(); 0 is unknown. \*/
	 unsigned short _cur_column;
	 signed char _vtable_offset;
	 char _shortbuf[1];
	 /\* char\* \_save\_gptr; char\* \_save\_egptr; \*/
	 _IO_lock_t \*_lock;
	#ifdef \_IO\_USE\_OLD\_IO\_FILE
};

所以在C语言上,进行写入的时候放进缓冲区,定期刷新

C语言打开的FILE是文件流。C++中的cout 是类;里面必定包含了 fd、buffer(缓冲区)

🌏设计用户层缓冲区的代码 ~ 实战
💢struct file的设计

在这里插入图片描述

struct MyFILE\_{                  
 	 int fd;            //文件描述符
	 char buffer[1024]; //缓冲区
	 int end;           //当前缓冲区的结尾
};

💢主函数

open文件 —— fputs输入 —— fclose关闭,接口函数都要我们逐一实现

int main()
{
	MyFILE \*fp = fopen\_("./log.txt", "r");
	if(fp = NULL)
	{
 		 printf("open file error");
 		return 0;
	}

	 fputs\_("hello world error", fp);
	 fclose\_(fp);
}

我们发现:C语言的接口一旦打开成功,全部都要带上FILE*结构,原因很简单,因为什么数据都在这个FILE结构体中

FILE \*fopen(const char \*path, const char \*mode);
//以下全是要带FILE\*
int fputc(int c, FILE \*stream);
int fclose(FILE \*fp);
size_t fread(void \*ptr, size_t size, size_t nmemb, FILE \*stream);

💢接口实现

💦fputs

在这里插入图片描述

    //此处刷新策略还没定 全部放进缓冲区
    void fputs\_(const char \*message, MyFILE \*fp)                                 
    {                                                                            
      assert(message);                                                           
      assert(fp);                                                                
                                                                                 
      strcpy(fp->buffer + fp->end, message);//abcde\0
      fp->end += strlen(message);                                                              
    }

运行结果:
在这里插入图片描述

上面覆盖了\0,strcpy会在结尾时候自动添加\0

若要往显示器上打印:变成行刷新

    if(fp->fd == 0)
    {
        //标准输入
    }
    else if(fp->fd == 1)
    {
        //标准输出
        if(fp->buffer[fp->end-1] =='\n' )
        {
            //fprintf(stderr, "fflush: %s", fp->buffer); //2
            write(fp->fd, fp->buffer, fp->end);
            fp->end = 0;
        }
    }
    else if(fp->fd == 2)
    {
        //标准错误
    }
    else


![](https://img-blog.csdnimg.cn/img_convert/9a8cb5f8c0ec69e6499adead0da6e95b.png)


最全的Linux教程,Linux从入门到精通

======================

1.  **linux从入门到精通(第2版)**

2.  **Linux系统移植**

3.  **Linux驱动开发入门与实战**

4.  **LINUX 系统移植 第2版**

5.  **Linux开源网络全栈详解 从DPDK到OpenFlow**



![华为18级工程师呕心沥血撰写3000页Linux学习笔记教程](https://img-blog.csdnimg.cn/img_convert/59742364bb1338737fe2d315a9e2ec54.png)



第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。



![华为18级工程师呕心沥血撰写3000页Linux学习笔记教程](https://img-blog.csdnimg.cn/img_convert/9d4aefb6a92edea27b825e59aa1f2c54.png)



**本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。**

> 需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友,可以点击这里获取!](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

27b825e59aa1f2c54.png)



**本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。**

> 需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论




**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化的资料的朋友,可以点击这里获取!](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**

**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值