使用多进程实现文件分段拷贝
创建三个进程:两个子进程分别负责拷贝文件的前半段和后半段,父进程负责回收子进程的资源。
代码实现
#include <myhead.h>
#include <fcntl.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <stdio.h>
#include <stdlib.h>
// 获取源文件的长度,并创建目标文件
int get_len(const char *p1, const char *p2) {
int fd1 = open(p1, O_RDONLY);
if (fd1 == -1) {
perror("fd1 open");
return -1;
}
int fd2 = open(p2, O_CREAT | O_WRONLY | O_TRUNC, 0644); // 打开创建目标文件
if (fd2 == -1) {
perror("fd2 open");
close(fd1);
return -1;
}
int len = lseek(fd1, 0, SEEK_END); // 计算源文件长度
close(fd1);
close(fd2);
return len;
}
// 拷贝文件的指定部分
int copy_file(const char *p1, const char *p2, int begin, int len) {
int fd1, fd2;
fd1 = open(p1, O_RDONLY); // 只读打开源文件
if (fd1 == -1) {
perror("fd1 open");
return -1;
}
fd2 = open(p2, O_WRONLY); // 只写打开目标文件
if (fd2 == -1) {
perror("fd2 open");
close(fd1);
return -1;
}
lseek(fd1, begin, SEEK_SET); // 将源文件指针移动到指定位置
lseek(fd2, begin, SEEK_SET); // 将目标文件指针移动到指定位置
int sum = 0;
char buff[1024];
while(1){
memset(buff,0,sizeof(buff));
int res = read(fd1,buff,sizeof(buff));
sum += res;
if(sum>=len||res == 0){
write(fd2,buff,res-(sum-len));
break;
}
write(fd2,buff,res);
}
close(fd1);
close(fd2);
return 0;
}
int main(int argc, const char *argv[]) {
if (argc != 3) {
printf("外部传参错误!\n");
return -1;
}
int len = get_len(argv[1], argv[2]); // 获取源文件的长度,打开创建目标文件
if (len == -1) {
return -1;
}
pid_t pid;
pid = fork();
if (pid == 0) { // 大儿子拷贝前一半
copy_file(argv[1], argv[2], 0, len / 2);
exit(EXIT_SUCCESS);
} else if (pid > 0) {
pid_t pid2;
pid2 = fork();
if (pid2 == 0) { // 二儿子拷贝后一半
copy_file(argv[1], argv[2], len / 2, len - len / 2); // 调用拷贝函数
exit(EXIT_SUCCESS);
} else if (pid2 > 0) { // 老父亲
wait(NULL); // 等待大儿子完成
wait(NULL); // 等待二儿子完成
} else {
perror("fork");
exit(EXIT_FAILURE);
}
} else {
perror("fork");
exit(EXIT_FAILURE);
}
return 0;
}
代码解释
-
获取文件长度并创建目标文件:
get_len
函数负责打开源文件p1
并计算其长度,同时创建目标文件p2
。- 使用
lseek
函数将文件指针移动到文件末尾,从而获取文件长度。
-
拷贝文件的指定部分:
copy_file
函数负责从源文件p1
中读取数据并写入目标文件p2
。- 函数接受四个参数:源文件路径、目标文件路径、起始位置和拷贝长度。
- 使用
lseek
函数将文件指针移动到指定的起始位置,然后循环读取和写入数据,直到拷贝完成指定长度的数据。
-
主函数:
- 检查命令行参数的数量,确保传入了源文件和目标文件的路径。
- 调用
get_len
函数获取源文件的长度,并创建目标文件。 - 创建第一个子进程,负责拷贝文件的前一半。
- 创建第二个子进程,负责拷贝文件的后一半。
- 父进程等待两个子进程完成。
运行结果
运行该程序后,目标文件 destination.txt
将包含源文件 source.txt
的完整内容。两个子进程分别负责拷贝文件的前半段和后半段,父进程负责回收子进程的资源。
总结
这段代码学习了如何使用多进程来实现文件的分段拷贝。信号量和多进程是非常有用的同步机制,可以确保多个进程按预期的顺序执行。在实际应用中,这种方法可以用于提高文件拷贝的效率,特别是对于大文件的拷贝。希望这篇博客对你理解多进程编程有所帮助。