这两天做系统升级业务,需要对“中间IO”进行偏移,在Linux环境下竟未找到相关的工具(像mount和dd等命令本身可以对IO进行偏移,但tar和cat等很多常用工具都没有偏移功能,如果通过dd命令进行转换,大多情况下会大幅降低IO效率),便考虑自己写一个该需求的工具。写好调试后,甚是高兴(代码极短,但大大提高了生产效率!)。将含有64字节包头的文件转换成不含包头的文件的需求,分别使用自己写的sread(skip read之意)工具和dd命令进行实现,效率对比如下:(本例效率提高10倍以上)
time -p dd if=1G.ttm of=1G2 bs=64c skip=1
16777216+0 records in
16777216+0 records out
1073741824 bytes (1.1 GB, 1.0 GiB) copied, 54.5429 s, 19.7 MB/s
real 54.59
user 3.59
sys 39.92
###############################################
time -p ./sread 1G.ttm 64 cat - > 1G1
real 25.02
user 0.01
sys 2.41
可以将sread视为tar、cat、dd...等命令的插件,以实现偏移读文件。如:
tar偏移64字节解压文件:./sread file 64 tar xf - 或 ./sread file 64 tar xf /dev/stdin
dd在不依赖bs选项情况下进行偏移读文件(当偏移量较小时可以大大提高效率): ./srad file 64 dd bs=64M if=/dev/stdin of=outfile (无需将bs设置为64字节,而可以更大,进而提高IO效率)。
sread源码:
1 #include<stdio.h>
2 #include<sys/types.h>
3 #include<unistd.h>
4 #include<sys/stat.h>
5 #include<fcntl.h>
6 #include<stdlib.h>
7 #include<error.h>
8
9 int main(int argc, char *argv[]){
10 if(argc < 4){
11 printf("Usage: %s <file> <seek size> <cmd...>/\n",argv[0]);
12 return -1;
13 }
14 int fd;
15 off_t offset;
16 pid_t pid;
17 if((fd=open(argv[1],O_RDONLY)) <0){
18 perror("open");
19 return -2;
20 }
21 offset=(off_t)atoll(argv[2]);
22 lseek(fd,offset,SEEK_SET);
23 if(dup2(fd,0) == -1){
24 perror("dup2");
25 return -3;
26 }
27 return(execvp(*(argv+3),argv+3));
28 }