Linux基础IO

1. c语言文件操作

1.1 写文件操作

写文件的过程:
1.打开文件:使用fopen()函数打开一个文件,需要指定文件名和打开模式("w"表示写入模式,如果文件不存在则创建,如果存在则清空原内容)。
2.写入数据:使用fwrite()fprintf()fputs函数将数据写入已打开的文件。
3.关闭文件:使用fclose()函数关闭已经打开的文件。

代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>

int main()
{
  FILE *fp = fopen("log.txt","w");
  if(fp == NULL)
  {
    perror("fopen");
    return 1;
  }
  //进行文件操作
  const char *s1= "hello fwrite\n";
  fwrite(s1,strlen(s1),1,fp);

  const char *s2= "hello fprintf\n";
  fprintf(fp,"%s",s2);

  const char *s3= "hello fputs\n";
  fputs(s3,fp);

  fclose(fp);
  return 0;
}

演示
**在这里插入图片描述

r  Open text file for reading.
	The stream is positioned at the beginning of the file.
r+ Open for reading and writing.
	The stream is positioned at the beginning of the file.
w  Truncate file to zero length or create text file for writing.
	The stream is positioned at the beginning of the file.
w+ Open for reading and writing.
	The file is created if it does not exist, otherwise it is truncated.
	The stream is positioned at the beginning of the file.
a  Open for appending (writing at end of file).
	The file is created if it does not exist.
	The stream is positioned at the end of the file.
a+ Open for reading and appending (writing at end of file).
	The file is created if it does not exist. The initial file position
	for reading is at the beginning of the file,
	but output is always appended to the end of the file.

1.2 读文件操作

读取文件步骤:
1.打开文件:使用fopen()函数打开一个文件,该函数需要指定文件名和打开模式("r"表示只读模式)。
2.读取数据:使用fread()或fgets()函数从打开的文件中读取数据。
3.关闭文件:使用fclose()函数关闭已经打开的文件。

代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>

int main()
{
  FILE *fp = fopen("log.txt","r");
  if(fp == NULL)
  {
    perror("fopen");
    return 1;
  }
  //进行文件操作
  char line[64];
  while(fgets(line,sizeof(line),fp)!=NULL)
  {
    fprintf(stdout,"%s",line);
  }

  fclose(fp);
  return 0;
}

演示
在这里插入图片描述

写一个Mycat

#include<stdio.h>
#include<unistd.h>
#include<string.h>

int main(int argc,char *argv[])
{
  if(argc!= 2)
  {
    printf("argv eror!\n");
    return 1;
  }
  FILE *fp = fopen(argv[1],"r");
  if(fp == NULL)
  {
    perror("fopen");
    return 2;
  }
  //进行文件操作
  char line[64];
  while(fgets(line,sizeof(line),fp)!=NULL)
  {
    fprintf(stdout,"%s",line);
  }

  fclose(fp);
  return 0;
}

演示
在这里插入图片描述

1.3 stdin & stdout & stderr

在C语言中,stdin、stdout和stderr是三个标准的I/O流,用于处理标准输入、标准输出和标准错误输出。它们是在标准库中预定义的文件指针,在C/C++程序中是默认打开的。

1.stdin:
是标准输入流,用于从用户(或其他来源)读取输入数据。通常情况下,stdin 关联着键盘输入,但在重定向或管道等情况下,它可以来自其他来源。

2.stdout :
是标准输出流,用于将程序的输出信息显示给用户。通常情况下,stdout 关联着终端或控制台。

3.stderr :
是标准错误输出流,用于输出错误信息或警告信息。通常情况下,stderr 也关联着终端或控制台。与 stdout 不同的是,stderr 通常不会被重定向,这样可以确保错误信息能够及时显示给用户。

stdout标准输出流与stderr标准错误输出流
代码:

#include <iostream>
#include <stdio.h>
#include <string.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>
#include <errno.h>

int main()
{
   //stdout -> 1
    printf("hello printf 1\n");
    fprintf(stdout,"hello fprintf 1\n");
    // stderr -> 2
    errno = 1;
    perror("hello perror 2"); //stderr

    const char *s1 = "hello write 1\n";
    write(1, s1, strlen(s1));

    const char *s2 = "hello write 2\n";
    write(2, s2, strlen(s2));

    // cout -> 1
    std::cout << "hello cout 1" << std::endl;
    // cerr -> 2
    std::cerr << "hello cerr 2" << std::endl;
    return 0;
 }

在这里插入图片描述

在这里插入图片描述

如果想将1,2输入同一文件

./Stdoe>log.txt  2>&1

2.系统文件IO

在Linux中,可以通过调用系统提供的系统调用接口来进行文件的读写操作。系统调用是用户程序与操作系统之间的接口,允许用户程序直接与操作系统内核进行通信。下面是使用系统调用进行文件读写的简单示例,其中主要涉及到的系统调用包括 open、read、write 和 close。其实,大多数编程语言的标准库中的 I/O 函数实际上会在底层调用操作系统提供的系统 I/O 接口。这是因为底层的文件操作、网络通信等需要与操作系统内核交互,而不同的操作系统可能在 I/O 处理方面有不同的实现方式。因此,编程语言的标准库提供了一种抽象层,使开发人员无需关注不同操作系统的细节,而可以使用统一的 API 进行文件和数据的读写。

这种抽象层的使用使得跨平台开发变得更加容易,因为开发人员可以在不同的操作系统上使用相同的函数调用,而不必关心操作系统的差异。

2.1 代码演示

open 函数以写入模式打开一个文件,并在文件不存在时创建它。如果文件打开成功,返回的文件描述符 fd 可以用于后续的文件操作,最后通过 close 函数关闭文件。

文件写入演示代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>

int main()
{
  umask(0);//默认权限
  int fd = open("log.txt",O_CREAT|O_WRONLY|O_TRUNC,0666);//创建|写|清空
  //int fd = open("log.txt",O_WRONLY);//只写
  if(fd< 0)
  {
    perror("open");
    return 1;
  }

  printf("open success,fd:%d\n",fd);

  const char *s= "hellow world\n";
  write(fd,s,strlen(s));

  close(fd);
}

文件读取演示代码:

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<sys/types.h>
#include<sys/stat.h>
#include<fcntl.h>

int main()
{
  umask(0);
  int fd = open("log.txt",O_RDONLY);
  if(fd< 0)
  {
    perror("open");
    return 1;
  }

  char buffer[64];
  memset(buffer,'\0',sizeof(buffer));
  read(fd,buffer,sizeof(buffer));
  printf("%s",buffer);

  close(fd);
}

2.2 IO接口介绍

open 是一个在 Unix/Linux 系统中用于打开文件的系统调用接口。它是进行文件操作的重要接口之一,用于打开文件以进行读取、写入或其他操作。下面是关于 open 函数的详细介绍:

函数原型:

int open(const char *pathname, int flags, mode_t mode);

参数说明:

pathname:要打开的文件路径。

flags:打开文件的标志,用于指定打开模式和行为。这些标志可以使用按位或运算组合起来。

mode:当使用 O_CREAT 标志时,指定新文件的权限。这个参数通常需要八进制形式的权限值,如 0644。

返回值:

成功时,返回文件描述符(一个非负整数),用于以后的文件操作。

失败时,返回 -1,并设置全局变量 errno 表示错误类型。

常用的 flags 参数:

O_RDONLY:只读模式打开文件。
O_WRONLY:只写模式打开文件。
O_RDWR:读写模式打开文件。
O_CREAT:如果文件不存在,则创建文件。
O_TRUNC:如果文件已存在,在打开时清空文件内容。
O_APPEND:在写入时追加到文件末尾。
O_EXCL:与 O_CREAT 一起使用,如果文件已存在,返回错误。
O_NONBLOCK:以非阻塞模式打开文件,读取和写入不会阻塞进程。
O_SYNCO_DSYNC:在每次写入操作后进行物理磁盘同步。

标记位原理演示
在这里插入图片描述
write、read、close 和 lseek ,Unix/Linux系统中用于文件操作的常用系统调用。

1.write:
函数原型:ssize_t write(int fd, const void *buf, size_t count);

作用:用于将数据从缓冲区写入文件。

参数:
fd:文件描述符,指示要写入的文件。
buf:要写入的数据的缓冲区。
count:要写入的字节数。

返回值:返回实际写入的字节数,如果返回值为 -1,则表示出错。

2.read:
函数原型:ssize_t read(int fd, void *buf, size_t count);

作用:从文件中读取数据到缓冲区。

参数:
fd:文件描述符,指示要读取的文件。
buf:存储读取数据的缓冲区。
count:要读取的字节数。

返回值:返回实际读取的字节数,如果返回值为 0,则表示已到达文件末尾;如果为 -1,则表示出错。

3.close:
函数原型:int close(int fd);

作用:关闭打开的文件。

参数:fd:文件描述符。

返回值:成功返回 0,出错返回 -1

4.lseek:
函数原型:off_t lseek(int fd, off_t offset, int whence);

作用:改变文件的当前偏移量,通常用于文件随机访问。

参数:
fd:文件描述符。
offset:偏移量的值。
whence:基准位置,可以是 SEEK_SET(文件开头)、SEEK_CUR(当前位置)或 SEEK_END(文件末尾)。

返回值:返回新的文件偏移量,出错返回 -1。

3.文件描述符fd

在Linux系统中,文件描述符(File Descriptor,通常缩写为 fd)是一个用于标识打开文件或其他I/O资源的整数。它是操作系统内核用来跟踪文件和I/O流的一种方式。文件描述符在C语言中通常用于标识和操作文件、套接字、管道等。

关于文件描述符的一些重要概念:
1.标准文件描述符:

在Unix/Linux系统中,有三个标准的文件描述符,分别为 0(标准输入)、1(标准输出)和 2(标准错误输出)。
这些标准文件描述符通常与终端或控制台相关联,用于用户输入和程序输出。

2.非标准文件描述符:

除了标准文件描述符外,系统还为每个打开的文件、套接字等分配一个唯一的文件描述符。
非标准文件描述符是非负整数,可以用于标识和操作特定的I/O资源。

3.文件描述符的范围:

通常情况下,文件描述符从0开始递增,但并不是所有的非负整数都是合法的文件描述符。
每个进程都有一定的最大文件描述符限制,可以通过 ulimit 命令查看。

在这里插入图片描述
文件描述符就是从0开始的小整数。当我们打开文件时,操作系统在内存中要创建相应的数据结构来描述目标文件。于是就有了file结构体。表示一个已经打开的文件对象。而进程执行open系统调用,所以必须让进程和文件关联起来。每个进程都有一个指针*files, 指向一张表files_struct,该表最重要的部分就是包涵一个指针数组,每个元素都是一个指向打开文件的指针!所以,本质上,文件描述符就是该数组的下标。所以,只要拿着文件描述符,就可以找到对应的文件。

文件描述符的分配规则:在files_struct数组当中,找到当前没有被使用的
最小的一个下标,作为新的文件描述符

4.重定向

看代码

#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <stdlib.h>
int main()
{
close(1);
int fd = open("myfile", O_WRONLY|O_CREAT, 00644);
if(fd < 0){
perror("open");
return 1;
}
printf("fd: %d\n", fd);
fflush(stdout);
close(fd);
exit(0);
}

此时,我们发现,本来应该输出到显示器上的内容,输出到了文件 myfile 当中,其中,fd=1。这种现象叫做输出
重定向。常见的重定向有:>, >>, <,<<
在这里插入图片描述

4.1dup2 系统调用

在 Linux 中,dup2 是一个系统调用,用于创建一个文件描述符的副本,并将副本连接到另一个文件描述符。它的原型如下:

int dup2(int oldfd, int newfd);

其中,oldfd 是现有的文件描述符,而newfd是你想要创建的新文件描述符。调用dup2(oldfd, newfd)会将newfd关联到oldfd所指向的文件,就像newfd是通过open或其他方式创建的一样。

具体来说,dup2 调用的作用是将文件描述符 newfd 关闭(如果 newfd 已经打开),然后复制 oldfd 的所有属性(包括文件状态标志、文件偏移量等),最终将 newfdoldfd指向的文件相连接。这意味着对于newfd的任何读取或写入操作都会影响到与 oldfd 相关联的文件。

dup2的典型用途之一是重定向标准输入、标准输出或标准错误流。通过将某个文件描述符与标准输入、标准输出或标准错误的文件描述符(0、1、2)连接,可以实现输入输出的重定向。

4.2缓存区

我们看下面的代码

#include <stdio.h>
#include <string.h>
int main()
{
	const char *msg0="hello printf\n";
	const char *msg1="hello fwrite\n";
	const char *msg2="hello write\n";
	printf("%s", msg0);
	fwrite(msg1, strlen(msg0), 1, stdout);
	write(1, msg2, strlen(msg2));
	fork();
	return 0;
}

运行出结果

hello printf
hello fwrite
hello write

如果对进程实现输出重定向呢? ./hello > file , 我们发现结果变成了:

hello write
hello printf
hello fwrite
hello printf
hello fwrite

对此我们简单模拟一下:

#include<stdio.h>
#include<unistd.h>
#include<fcntl.h>
#include<string.h>
#include<assert.h>
#include<stdlib.h>

#define NUM 1024

struct MyFILE_
{
  int fd;
  char buffer[NUM];
  int end;// 缓冲区结尾
};

typedef struct MyFILE_ MyFILE;

MyFILE *fopen_(const char *pathname,const char *mode)
{
  assert(pathname);
  assert(mode);
  MyFILE *fp = NULL;

  if(strcmp(mode,"r")== 0)
  {

  }
  else if(strcmp(mode,"r+")== 0)
  {

  }
  else if(strcmp(mode,"w")== 0)
  {
    int fd = open(pathname, O_WRONLY | O_TRUNC | O_CREAT, 0666);
    if(fd >= 0)
     {
       fp = (MyFILE*)malloc(sizeof(MyFILE));
       memset(fp, 0, sizeof(MyFILE));
       fp->fd = fd;
     }
  }
  else if(strcmp(mode,"w+")== 0)
  {

  }
  else if(strcmp(mode,"a")== 0)
  {

  }
  else if(strcmp(mode,"a+")== 0)
  {

  }
  else 
  {
    //无操作
  }

  return fp;
}

void fputs_(const char *message,MyFILE *fp)
{
    assert(message);
    assert(fp);

    strcpy(fp->buffer+fp->end, message); //abcde\0
    fp->end += strlen(message);

     if(fp->fd == 0)
    {
        //标准输入
    }
    else if(fp->fd == 1)
    {
        //标准输出
        if(fp->buffer[fp->end-1] =='\n' )
        {
            write(fp->fd, fp->buffer, fp->end);
            fp->end = 0;
        }
    }
    else if(fp->fd == 2)
    {
        //标准错误
    }
    else
    {
        //其他文件
    }
}

void fflush_(MyFILE *fp)
{
  assert(fp);
  if(fp->end != 0)
  {
     //将数据写到了内核
     write(fp->fd, fp->buffer, fp->end);
     syncfs(fp->fd); //将数据写入到磁盘
     fp->end = 0;
  }
}

void fclose_(MyFILE *fp)
{
  assert(fp);
  fflush_(fp);
  close(fp->fd);
  free(fp);
}


int main()
{
  MyFILE *fp= fopen_("./log.txt","w");
  if(fp == NULL)
  {
    printf("open file error");
    return 1;
  }

  fputs_("hello world",fp);

  fclose_(fp);
}

fopen_:

这个函数模拟了 C 标准库中的 fopen 函数。根据给定的文件路径和打开模式,创建并返回一个 MyFILE 结构体指针。根据模式不同,可以选择以只写、只读等方式打开文件。
MyFILE 结构体包含了一个文件描述符 fd,一个缓冲区 buffer,以及 end 表示当前缓冲区的结尾位置。
当以写入模式打开文件时,会调用系统的 open 函数,分配并初始化一个 MyFILE 结构体,用于后续的文件写入。

fputs_:

这个函数模拟了 C 标准库中的 fputs 函数。它将给定的字符串写入到 MyFILE 结构体的缓冲区中,然后根据文件描述符的不同,选择是否将缓冲区中的数据写入文件。
在写入标准输出时,会检查缓冲区的内容,如果末尾是换行符,则执行实际的写入操作,并清空缓冲区。

fflush_:

这个函数模拟了 C 标准库中的 fflush 函数。它将 MyFILE 结构体缓冲区中的数据写入文件,并使用 syncfs 函数将数据同步到磁盘。

fclose_:

这个函数模拟了 C 标准库中的 fclose 函数。它首先调用 fflush_ 函数,确保缓冲区数据写入文件,然后关闭文件描述符,并释放分配的 MyFILE 结构体内存。

4.3在Myshell中添加重定向功能

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <fcntl.h>
#include <sys/wait.h>  // 添加头文件以支持 waitpid 函数

#define MAX_CMD 1024

char command[MAX_CMD];

// 获取用户输入命令
int do_face() {
    memset(command, 0x00, MAX_CMD);
    printf("minishell$ ");
    fflush(stdout);
    // 使用 scanf 读取用户输入,遇到换行符为止
    if (scanf("%[^\n]%*c", command) == 0) {
        getchar();
        return -1;
    }
    return 0;
}

// 解析命令行输入,将输入命令分解成参数列表
char **do_parse(char *buff) {
    int argc = 0;
    static char *argv[32];  // 最多支持 32 个参数
    char *ptr = buff;
    while (*ptr != '\0') {
        if (!isspace(*ptr)) {
            argv[argc++] = ptr;
            while ((!isspace(*ptr)) && (*ptr) != '\0') {
                ptr++;
            }
        } else {
            while (isspace(*ptr)) {
                *ptr = '\0';  // 将空白字符替换为字符串结束符
                ptr++;
            }
        }
    }
    argv[argc] = NULL;  // 参数列表以 NULL 结尾
    return argv;
}

// 处理重定向操作
int do_redirect(char *buff) {
    char *ptr = buff, *file = NULL;
    int type = 0, fd, redirect_type = -1;
    while (*ptr != '\0') {
        if (*ptr == '>') {
            *ptr++ = '\0';
            redirect_type++;
            if (*ptr == '>') {
                *ptr++ = '\0';
                redirect_type++;
            }
            while (isspace(*ptr)) {
                ptr++;
            }
            file = ptr;
            while ((!isspace(*ptr)) && *ptr != '\0') {
                ptr++;
            }
            *ptr = '\0';
            if (redirect_type == 0) {
                fd = open(file, O_CREAT | O_TRUNC | O_WRONLY, 0664);
            } else {
                fd = open(file, O_CREAT | O_APPEND | O_WRONLY, 0664);
            }
            dup2(fd, 1);  // 将标准输出重定向到文件
        }
        ptr++;
    }
    return 0;
}

// 执行命令
int do_exec(char *buff) {
    char **argv = {NULL};
    int pid = fork();  // 创建子进程
    if (pid == 0) {  // 子进程中执行命令
        do_redirect(buff);
        argv = do_parse(buff);
        if (argv[0] == NULL) {
            exit(-1);
        }
        execvp(argv[0], argv);  // 执行命令
    } else {  // 父进程等待子进程执行结束
        waitpid(pid, NULL, 0);
    }
    return 0;
}

int main(int argc, char *argv[]) {
    while (1) {
        if (do_face() < 0)
            continue;
        do_exec(command);  // 执行用户输入的命令
    }
    return 0;
}

do_face() 函数:

该函数用于显示命令提示符,读取用户输入的命令。
使用 scanf 函数读取用户输入的一行命令,并将其存储在 command 缓冲区中。

do_parse() 函数:

该函数用于解析命令行输入,将输入命令分解成参数列表。
通过遍历输入的字符,将非空白字符作为参数的起始位置,并将参数分割为单独的字符串。
参数列表会存储在 argv 数组中,每个元素都指向一个参数字符串,最后一个元素为 NULL。

do_redirect() 函数:

该函数用于处理重定向操作,将标准输出重定向到指定文件。
在命令字符串中寻找 > 符号,根据符号后的内容判断重定向的类型和目标文件名,然后使用文件操作函数打开该文件并将标准输出重定向到该文件。

do_exec() 函数:

该函数用于执行解析后的命令。
使用 fork 创建子进程,子进程中调用 do_redirect() 进行重定向,然后使用 execvp() 函数执行命令。

main() 函数:

主函数使用一个无限循环,等待用户输入命令并执行。
调用 do_face() 获取用户输入,并在 do_exec() 中执行命令。

5.文件系统

我们使用ls -l的时候看到的除了看到文件名,还看到了文件元数据
在这里插入图片描述
共有 7 列信息,每列代表了不同的属性。以下是每列信息所代表的含义:

  1. 文件权限和类型。这列显示了文件的权限和类型。在这个例子中,- 表示这是一个普通文件。后面的 rw-rw-r–. 表示文件的权限,分为三组(所有者、群组、其他用户),每组的权限有读取(r)、写入(w)和执行(x)。
  2. 硬链接计数。这列显示了文件的硬链接计数,即有多少个目录项指向这个文件。在这里,值为 1 表示只有一个目录项指向这个文件。
  3. 所有者。这列显示了文件的所有者用户名。
  4. 所属群组。这列显示了文件所属的用户组。
  5. 文件大小。这列显示了文件的大小,以字节为单位。
  6. 最后修改时间。这列显示了文件的最后修改时间,格式为月份(Aug)、日期(9)和时间(08:30)。
  7. 文件名。这列显示了文件的名称。

ls -l读取存储在磁盘上的文件信息,然后显示出来
在这里插入图片描述
除了通过这种方式来读取,还有一个stat命令能够看到更多信息

[root@localhost linux]# stat test.c
File: "test.c"
Size: 654 Blocks: 8 IO Block: 4096 普通文件
Device: 802h/2050d Inode: 263715 Links: 1
Access: (0644/-rw-r--r--) Uid: ( 0/ root) Gid: ( 0/ root)
Access: 2017-09-13 14:56:57.059012947 +0800
Modify: 2017-09-13 14:56:40.067012944 +0800
Change: 2017-09-13 14:56:40.069012948 +0800

inode
简单了解一下文件系统
在这里插入图片描述
Linux ext2文件系统,上图为磁盘文件系统图(内核内存映像肯定有所不同),磁盘是典型的块设备,硬盘分区被划分为一个个的block。一个block的大小是由格式化的时候确定的,并且不可以更改。例如mke2fs的-b选项可以设定block大小为1024、2048或4096字节。而上图中启动块(Boot Block)的大小是确定的。

Block Group:ext2文件系统会根据分区的大小划分为数个Block Group。而每个Block Group都有着相同的结构组成。
超级块(Super Block):存放文件系统本身的结构信息。记录的信息主要有:bolck 和 inode的总量,未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个文件系统结构就被破坏了。
GDT,Group Descriptor Table:块组描述符,描述块组属性信息。
块位图(Block Bitmap):Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用。
inode位图(inode Bitmap):每个bit表示一个inode是否空闲可用。
i节点表:存放文件属性 如 文件大小,所有者,最近修改时间等。
数据区:存放文件内容。

将属性和数据分开存放的想法看起来很简单,但实际上是如何工作的呢?我们通过touch一个新文件来看看如何工作?

[kingxzq@localhost Documents]$ touch abc
[kingxzq@localhost Documents]$ ls -i abc
263466 abc

为了说明问题,我们将上图简化:
在这里插入图片描述
创建一个新文件主要有以下4个操作

1.存储属性
内核先找到一个空闲的i节点(这里是263466)。内核把文件信息记录到其中。

2.存储数据
该文件需要存储在三个磁盘块,内核找到了三个空闲块:300,500,800。将内核缓冲区的第一块数据复制到300,下一块复制到500,以此类推。

3.记录分配情况
文件内容按顺序300,500,800存放。内核在inode上的磁盘分布区记录了上述块列表。

4.添加文件名到目录
新的文件名abc,linux如何在当前的目录中记录这个文件?内核将入口(263466,abc)添加到目录文件。文件名和inode之间的对应关系将文件名和文件的内容及属性连接起来。

6.软硬链接

在 Linux 中,硬链接(Hard Link)和软连接(Symbolic Link,也称为软链接或符号链接)都是用于创建文件链接的概念,但它们有一些重要的区别。

硬链接(Hard Link):

硬链接是指在文件系统中创建一个文件的副本,这个副本与原始文件共享相同的 inode(索引节点)。因此,硬链接与原始文件在文件系统中的位置和属性是一样的,它们实际上指向同一个数据块。删除一个硬链接并不会影响其他硬链接或原始文件,只有所有的链接都被删除后,文件的内容才会真正被释放。

硬链接的特点:

硬链接没有独立的文件大小,因为它们共享相同的数据块。
硬链接不跨越文件系统边界,即不能链接到不同文件系统的文件。
硬链接不能链接到目录。

软连接(Symbolic Link,Symbolic Link,Symlink):

软连接是一个指向目标文件或目录的特殊文件,其中包含了目标文件的路径。它实际上是一个指向另一个文件的快捷方式,就像 Windows 系统中的快捷方式一样。软连接与硬链接不同,它有自己的 inode,并且可以跨越文件系统边界。

软连接的特点:

软连接有独立的文件大小,因为它包含了目标文件的路径信息。
软连接可以链接到不同文件系统的文件。
删除原始文件或目录不会影响软连接,但删除软连接不会影响原始文件。

创建硬链接:

[b@localhost ~]$ ln original.txt  hardlink.txt

这将在同一目录下创建了一个名为 hardlink.txt 的硬链接。现在,original.txt 和 hardlink.txt 是硬链接,它们共享相同的 inode 和数据块,如下输出。

[b@localhost ~]$ ll -i
total 0
37444362 -rw-rw-r--. 2 kingxzq kingxzq 0 Aug 24 15:22 hardlink.txt
37444362 -rw-rw-r--. 2 kingxzq kingxzq 0 Aug 24 15:22 original.txt

...

在我们的每个目录下,都隐藏着两个文件,....代表当前路径,..是上一级路径,它们的本质实际就是硬链接

创建软链接:

[b@localhost ~]$ ln -s original.txt  symlink.txt

软链接symlink.txt则拥有独立空间,所以inode与源文件并不相同,可以理解为快捷方式

[b@localhost ~]$ ll -i
total 0
37444362 -rw-rw-r--. 2 kingxzq kingxzq  0 Aug 24 15:22 hardlink.txt
37444362 -rw-rw-r--. 2 kingxzq kingxzq  0 Aug 24 15:22 original.txt
37444368 lrwxrwxrwx. 1 kingxzq kingxzq 12 Aug 24 15:28 symlink.txt -> original.txt

这将在同一目录下创建了一个名为 symlink.txt 的软链接。现在,symlink.txt 是一个指向 original.txt 的符号链接。

现在,假设你编辑了 original.txt 中的内容。然后你可以观察到:

硬链接:original.txt 和 hardlink.txt 都会反映出内容的更改,因为它们实际上是同一个文件的两个名称。
软链接:symlink.txt 也会反映出内容的更改,因为它指向了 original.txt 的路径,而不是实际的数据块。

删除 original.txt 文件,可以观察到:

硬链接:即使删除了 original.txt,hardlink.txt 仍然存在,因为硬链接与原始文件共享相同的数据块。
软链接:删除了 original.txt 后,symlink.txt 将变为无效,因为它指向的目标不存在。

总结:

硬链接是在文件系统中创建的原始文件的副本,它们共享相同的 inode 和数据块。
软链接是一个指向目标文件的特殊文件,它包含了目标文件的路径信息。
在选择使用硬链接还是软链接时,需要根据具体情况考虑不同的需求和限制。

7.静态库和动态库

在 Linux 中,静态库(.a)(Static Library)和动态库(.so)(Dynamic Library)是两种不同的库文件形式,用于在编程中共享和重用代码。它们有不同的特点和用途。

静态库(Static Library)

静态库是编译时链接到程序中的一组函数和数据的集合。当你使用静态库时,编译器将库中的代码复制到你的程序中,使你的程序可以独立运行,不需要依赖外部的库文件。每个使用了静态库的可执行文件都会包含库的一份拷贝。

主要特点:

静态库会被完整地嵌入到最终可执行文件中,使得可执行文件变得比较大。
每个可执行文件都包含了库的副本,因此可执行文件更为独立,无需在运行时依赖外部库。
静态库的更新需要重新编译和链接可执行文件。

动态库(Dynamic Library):

动态库是在程序运行时加载的库,它不会被复制到可执行文件中,而是在系统中以共享的形式存在。多个程序可以共享同一个动态库,从而节省内存和磁盘空间。动态库在系统中只有一份实例,被多个程序共享使用。

主要特点:

动态库在运行时被加载,程序只需要引用动态库的接口,而不会包含库的实际代码。
可执行文件比较小,因为不包含库的代码。
动态库的更新只需要替换库文件,不需要重新编译可执行文件。

使用静态库和动态库的选择取决于不同的因素,如代码的重用性、可执行文件大小、内存占用和依赖关系。静态库适合于简单的应用,而动态库适用于需要共享的功能和模块。

总之,静态库将代码嵌入到可执行文件中,动态库在运行时加载并共享,两者在性能、依赖和文件大小等方面有所不同。

演示程序

mymath.h

#pragma once

#include<stdio.h>

extern int addToTarget(int from, int to);

mymath.c

#include "mymath.h"

int addToTarget(int from, int to)
{
    int sum = 0;
    for(int i = from; i <= to; i++)
    {
        sum += i;
    }

    return sum;
}

myprint.h

#pragma once

#include <stdio.h>
#include <time.h>

extern void Print(const char *str);

myprint.c

#include "myprint.h"

void Print(const char *str)
{
    printf("%s[%d]\n", str, (int)time(NULL));
}

main.c

#include "myprint.h"
#include "mymath.h"

int main()
{
    Print("hello world");
    int res = addToTarget(1,100);

    printf("res: %d\n", res);
    
    return 0;
}

7.1生成静态库

我们先编写Makefile文件

libhello.a: mymath.o myprint.o
	ar -rc libhello.a mymath.o myprint.o  #生成静态库 ar是gnu归档工具,rc表示(replace and create)
mymath.o:mymath.c
	gcc -c mymath.c -o mymath.o
myprint.o:myprint.c
	gcc -c myprint.c -o myprint.o

.PHONY:hello
hello:
	mkdir -p hello/lib
	mkdir -p hello/include
	cp -rf *.h hello/include
	cp -rf *.a hello/lib

.PHONY:clean
clean:
	rm -rf *.o libhello.a hello

我们直接执行make libhello.a命令

[b@localhost 10-31]$ make libhello.a
gcc -c mymath.c -o mymath.o
gcc -c myprint.c -o myprint.o
ar -rc libhello.a mymath.o myprint.o

生成libhello.a链接先执行生成.o文件,查看静态库中的目录列表

[b@localhost 10-31]$ ar -tv libhello.a
rw-rw-r-- 1001/1001   1272 Nov 24 05:34 2023 mymath.o
rw-rw-r-- 1001/1001   1584 Nov 24 05:34 2023 myprint.o

t:列出静态库中的文件
v:verbose 详细信息

通过静态库编译程序

[b@localhost 10-31]$ gcc main.c -I . -L . -lhello
[b@localhost 10-31]$ ./a.out
hello world[1700834157]
res: 5050

-I 头文件搜索路径

-L 指定库路径

-l 指定库名

测试目标文件生成后,静态库删掉,程序照样可以运行

库搜索路径

从左到右搜索-L指定的目录。
由环境变量指定的目录 (LIBRARY_PATH)
由系统指定的目录
/usr/lib
/usr/local/lib

生成静态库时文件需在其中之一的路径下

7.2生成动态库

首先编写Makefile文件

libhello.so:mymath_d.o myprint_d.o
	gcc -shared mymath_d.o myprint_d.o -o libhello.so  #shared: 表示生成共享库格式
mymath_d.o:mymath.c
	gcc -c -fPIC mymath.c -o mymath_d.o   #fPIC:产生位置无关码(position independent code)
myprint_d.o:myprint.c
	gcc -c -fPIC myprint.c -o myprint_d.o

.PHONY:hello
hello:
	mkdir -p hello/lib
	mkdir -p hello/include
	cp -rf *.h hello/include
	cp -rf *.so hello/lib

.PHONY:clean
clean:
	rm -rf *.o *.a *.so hello

直接执行make libhello.so命令

[b@localhost 10-312]$ make libhello.so
gcc -c -fPIC mymath.c -o mymath_d.o   #fPIC:产生位置无关码(position independent code)
gcc -c -fPIC myprint.c -o myprint_d.o
gcc -shared mymath_d.o myprint_d.o -o libhello.so  #shared: 表示生成共享库格式

再执行make hello

[b@localhost 10-312]$ make hello
mkdir -p hello/lib
mkdir -p hello/include
cp -rf *.h hello/include
cp -rf *.so hello/lib

hello所包含文件

[b@localhost 10-312]$ tree hello
hello
├── include
│   ├── mymath.h
│   └── myprint.h
└── lib
    └── libhello.so

2 directories, 3 files

输入gcc main.c -I hello/include -L hello/lib -lhello
(如果目录下同时有静态库和动态库,会优先用动态库,若要使用静态库,可在最后加上-static
可直接生成可执行程序,但在部分情况下 可执行程序运行却提示 无法加载到动态库

查看链接

[b@localhost 10-312]$ ldd a.out
	linux-vdso.so.1 =>  (0x00007ffe38b11000)
	libhello.so => not found #没有找到
	libc.so.6 => /lib64/libc.so.6 (0x00007f73a2e12000)
	/lib64/ld-linux-x86-64.so.2 (0x00007f73a31e0000)

库的工作原理
静态库如何被加载

  • 在程序编译的最后一个阶段也就是链接阶段,提供的静态库会被打包到可执行程序中。当可执行程序被执行,静态库中的代码也会一并被加载到内存中,因此不会出现静态库找不到无法被加载的问题。

动态库如何被加载

在程序编译的最后一个阶段也就是链接阶段:

  • 在gcc命令中虽然指定了库路径(使用参数 -L ), 但是这个路径并没有记录到可执行程序中,只是检查了这个路径下的库文件是否存在。
  • 同样对应的动态库文件也没有被打包到可执行程序中,只是在可执行程序中记录了库的名字。

可执行程序被执行起来之后:

  • 程序执行的时候会先检测需要的动态库是否可以被加载,加载不到就会提示上边的错误信息 当动态库中的函数在程序中被调用了,
  • 这个时候动态库才加载到内存,如果不被调用就不加载 动态库的检测和内存加载操作都是由动态连接器来完成的

简单来讲程序只会在以下地方找动态库
1.可执行文件内部的 DT_RPATH

2.系统的环境变量 LD_LIBRARY_PATH

3.系统动态库的缓存文件 /etc/ld.so.cache

4.存储动态库/静态库的系统目录 /usr/lib,/usr/local/lib

所以我们需要将动态库的路径放到对应的环境变量或者系统配置文件中,同样也可以将动态库拷贝到系统库目录(或者是将动态库的软链接文件放到这些系统库目录中)。

1.可执行文件内部的 DT_RPATH
无法改变

2.系统的环境变量 LD_LIBRARY_PATH
查看环境变量

[b@localhost 10-312]$ echo $LD_LIBRARY_PATH
:/home/b/.VimForCpp/vim/bundle/YCM.so/el7.x86_64:/home/b/.VimForCpp/vim/bundle/YCM.so/el7.x86_64

输入命令

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:动态库绝对路径

这时就可以正常链接到动态库了
但是这种方法存在缺陷,在你下一次重新连接用户时,又会链接失败了,因为此环境变量属于内存级的环境变量

3.系统动态库的缓存文件 /etc/ld.so.cache
/etc/ld.so.conf.d/ 路径添加配置文件

在该路径下随便建立一个.conf文件,将动态库路径拷贝到这个.conf文件中,保存关闭后,输入ldconfig更新配置文件(注意权限问题)

4.存储动态库/静态库的系统目录 /usr/lib,/usr/local/lib

 # 库拷贝
sudo cp /xxx/xxx/libxxx.so /usr/lib

# 创建软连接
sudo ln -s /xxx/xxx/libxxx.so /usr/lib/libxxx.so

7.3使用外部库

在 Linux 中,要使用外部数学库(例如数学函数库),你需要通过编译器的链接选项来指定链接到这些库。常见的数学库是 libm,它包含了数学函数如 sincossqrt 等。

当你在编译源代码时需要使用数学库时,可以使用 -lm 选项来告诉编译器链接到数学库。以下是使用外部数学库的示例:

gcc -o my_program my_program.c -lm

其中:

-o my_program:指定输出的可执行文件名为 my_program
my_program.c:源代码文件名。
-lm:告诉编译器链接到数学库(libm)。
通过这个编译命令,编译器会自动查找并链接到数学库,使得你的程序可以使用数学函数。

需要注意的是,-lm 应该放在源代码文件名的后面,以便编译器在链接时正确地解析数学库的符号。如果你还需要链接到其他库,可以在同一命令中使用多个-l选项,如 -lm -l其他库名

  • 23
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值