Linux基础IO

最新推荐文章于 2024-02-19 14:29:37 发布

Science52

最新推荐文章于 2024-02-19 14:29:37 发布

阅读量589

点赞数 5

文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/weixin_72068014/article/details/128338807

版权

文件路径及shell的完善

文件基本操作及其C语言的文件操作接口

stdin & stdout & stderr

文件路径及shell的完善

在上一次的进程控制中，我们模拟了一个shell，但是我们会发现下面这个问题：

我们可以通过ls /proc/进程编号 -al来查看进程的当前路径。

为什么这里不能退出到上级路径呢？

因为我们使用的是子进程帮我们执行，子进程改变了路径并不影响父进程，当子进程退出的时候，我们使用的还是父进程的路径，这也就是为什么我们使用pwd看的时候路径是没有改变的。

那么如果解决呢？还有其他指令也会这样吗？

那肯定是有一些指令也是这样的，而且导致的原因都是一样的。既然我们想要改变的是父进程的路径，那么我们肯定要在创建子进程之前完成，并退出这一次循环。这种操作叫内建命令。echo也是一样的，我们要看到的是父进程的返回。下面看看如何完善：

在解决cd的问题时，我们应该要使用到这个系统调用接口：chdir，可以帮助我们改变路径

看看代码：

结果：

结果正如我们所料的那样，那么echo命令其实也是大致一样的操作而已：

下面直接看代码和结果：

结果：

这个shell虽然还有点bug，但是基本满足需求了。

文件基本操作及其C语言的文件操作接口

在C语言中，我们学习了文件的简单操作，就是通常的三步走：打开文件fopen，对文件进行写入或者读出，关闭文件fclose。

下面我们通过代码来回忆一下这些操作：

文件的写操作：

结果：

文件的读操作：

结果：

stdin & stdout & stderr

C 默认会打开三个输入输出流，分别是 stdin, stdout, stderr

仔细观察发现，这三个流的类型都是 FILE*, fopen 返回值类型，文件指针

总结文件的基本操作：

r,w,a: r+(读写,不存在出错),w+(读写, 不存在创建), a(append, 追加), a+()

提一下文件的权限问题，之前在讲权限的时候已经有详细的说明，这里简单回忆：
在我们创建文件的时候可以设置文件的权限，而这个文件的权限就等于文件初始值&（~umask）

系统文件I/O

操作文件，除了上述 C 接口（当然， C++ 也有接口，其他语言也有），我们还可以采用系统接口来进行文件访问：

接口介绍:

open :

头文件：

#include <sys/types.h>

#include <sys/stat.h>

#include <fcntl.h>

使用方式：

int open(const char *pathname, int flags);

int open(const char *pathname, int flags, mode_t mode);

pathname: 要打开或创建的目标文件

flags: 打开文件时，可以传入多个参数选项，用下面的一个或者多个常量进行“或”运算，构成flags。

下面通过代码的方式看看其中的原理：
// 每一个宏，对应的数值，只有一个比特位是1,彼此位置不重叠
#define ONE (1<<0)
#define TWO (1<<1)
#define THREE  (1<<2)
#define FOUR (1<<3)


void show(int flags)
{
    if(flags & ONE) printf("one\n");
    if(flags & TWO) printf("two\n");
    if(flags & THREE) printf("three\n");
    if(flags & FOUR) printf("four\n");
}


int main()
{
	show(ONE);
    printf("-----------------------\n");
    show(TWO);
    printf("-----------------------\n");
    show(ONE | TWO);
    printf("-----------------------\n");
    show(ONE | TWO | THREE);
    printf("-----------------------\n");
    show(ONE | TWO | THREE | FOUR);
    printf("-----------------------\n");


	return 0;
}
看看结果：
参数:

O_RDONLY: 只读打开

O_WRONLY: 只写打开

O_RDWR : 读，写打开

这三个常量，必须指定一个且只能指定一个

O_CREAT : 若文件不存在，则创建它。需要使用 mode 选项，来指明新文件的访问权限

O_APPEND: 追加写

返回值：

成功：新打开的文件描述符

失败： -1

write read close lseek , 类比 C 文件相关接口。

read：

write：

写文件：

结果：

但是如果我们写重新一些数据：

结果：

我们可以看到这里出现了很大的不同的结果，结果多了一些东西，为什么呢？

因为这是系统，在语言层次上，语言库中的接口是重新写入的话就会把数据清空，但是在系统层面就不会，系统是以二进制的方式写入，它不会关心里面有没有数据，当然如果你调用系统接口（也就是在刚刚的打开文件的步骤加多一个选项TRUNC的选项就可以先清空再写入。）

为什么会这样呢？原因很简单，那就是语言是在系统之上的。在之前的进程概念的时候就已经很详细的说明了这个观点了

所以，可以认为，f#系列的函数，都是对系统调用的封装，方便二次开发

读文件：

结果：

文件描述符fd

我们刚刚已经接触到了文件描述符了，看下这段代码：

我们可以看到结果是3，那为什么是3呢？0，1，2是什么呢？

在上面已经提到了stdin & stdout & stderr，这3个流，

Linux 进程默认情况下会有 3 个缺省打开的文件描述符，分别是标准输入 0 ，标准输出 1 ，标准错误 2.

0,1,2对应的物理设备一般是：键盘，显示器，显示器

那我们也就可以这样输出了：

输入一次，输出两次：

文件描述符就是从0开始的小整数。当我们打开文件时，操作系统在内存中要创建相应的数据结构来描述目标文件（操作系统要管理文件，就要先描述，后组织）。于是就有了fifile 结构体。表示一个已经打开的文件对象。而进程执行 open 系统调用，所以必须让进程和文件关联起来。每个进程都有一个指针*fifiles, 指向一张表 fifiles_struct, 该表最重要的部分就是包涵一个指针数组，每个元素都是一个指向打开文件的指针！所以， 本质上，文件描述符就是该数组的下标。所以，只要拿着文件描述符，就可以找到对应的文件

文件描述符的分配规则

所谓的分配规则就是低处分配，就好像刚刚我们打印文件的fd时发现它等于3，如果我们观点0或者2那么相应的fd就会变成0或者2，看看结果：

我们可以看到确实如我们所见结果为0；

如果close2呢？结果如下：

结果验证了正如刚刚所说的，这确实是一个数组，然后从小到大开始分配。

重定向

刚刚那个代码，如果close的是1呢？也就是标准输出，结果如何呢？

如果我们把代码改成这样呢？

结果：

我们就会发现原来我们想在1号标准输出输出的，结果最后输出到了我们创建的文件中了。这就完成了一次重定向。

那重定向的本质是什么呢？

重定向的本质是上层的fd不变，在内核中改变文件指针的指向，下面使用画图的方式去解释：

使用 dup2 系统调用

函数原型如下 :

头文件：#include <unistd.h>

使用方式：int dup2(int oldfd, int newfd);

下面我们来讨论一下这两个参数是怎么回事，

如果我们要调用dup2这个接口：我们应该是这样使用dup2（fd，1）还是dup2（1，fd）呢？也就是哪个是新的哪个是旧的？

从上面的解释我们可以知道我们应该是fd->1，也就是应该使用第一种方式去调用。

看看大致的使用方法：输出重定向：

结果如下：

输入结果没问题，但是顺序为什么是乱的呢，这个后面会提到。

输入重定向：

我们把fd重定向到0号，也就是输入重定向，这样的话我们就可以不用自己输入，从而读取文件中的信息，按行来读，知道文件信息全部读完。

学习了重定向之后，我们可以把我们之前实现的shell再加一个重定向的功能：

首先重定向肯定是由子进程来完成的，因为进程的独立性所有对父进程没有影响，但是父进程在进行指令分析的时候要分析出其中是否要重定向，是输入重定向>还是输出重定向<或者是追加重定向>>。

我们可以专门写一个函数来判断是否要求重定向，然后通过一个变量来记录重定向，最后通过子进程来实现重定向。

下面看代码：

子进程执行：

全部代码：