实验二 同步与异步write的效率比较
一:实验目的
掌握unix的文件I/O系统调用。
二:要求
1. 实验要求程序必须指定输出的文件名,而该文件是否按同步方式打开,则是可以选择的。因此程序至少带一个,至多两个输入参数。程序默认从标准输入STDIN_FILENO读取输入文件,可以利用shell的输入定向功能选择具体的输入文件。
2. 系统调用times()的说明
#include <sys/times.h>
clock_t times(struct tms *buf);
struct tms {
clock_t tms_utime; /* 记录进程除系统调用外所使用的CPU时间 */
clock_t tms_stime; /* 记录进程的系统调用所使用的CPU时间 */
clock_t tms_cutime; /* 记录子进程除系统调用外所使用的CPU时间 */
clock_t tms_cstime; /* 记录子进程的系统调用所使用的CPU时间 */
};
times函数的返回值是进程迄今为止的存活时间。所有时间都是以“滴答”为单位的,函数sysconf(_SC_CLK_TCK)可获得所运行系统每秒的滴答数(参考课本P33)。
三.设计和实现的主要原理、构思、算法、执行过程。
1. 将打开的文件的BUFFSIZE大小的块读入缓冲区,循环执行到全部读完,在每次读的过程中调用write进行写操作。
2, 在每次写之前调用时间函数测量一次时间,之后再调用一次时间函数测量时间,两次时间差就是write的写时间,将其记录就得到了write写整个文件的时间。
3, 每次将BUFFSIZE增大两倍,调用lseek函数使文件偏移量在整体读完一次后返回文件头。
四.具体的程序如下
#include "apue.h"
#include <sys/times.h>
#include <malloc.h>
#include <fcntl.h>
#include<string.h>
#include<stdio.h>
int main(int argc,char *argv[])
{
int length,n,dida,size,i,fout,loop;
char *buff;
clock_t cstart,cend;
struct tms sstart,send;
float utime,stime,ctime;
if(argc!=2&&argc!=3){
printf("input error!!\n");
exit(-1);
}
if(argc==2){//当有两个参数的时候,即异步执行时
if((fout=open(argv[1],O_RDWR | O_CREAT|O_TRUNC,FILE_MODE))<0){
printf("openerror!!!\n");
exit(1);
}
}
else if(argc==3){//当有三个参数,即同步执行时
if(strcmp(argv[2],"sync")!=0){//输入非法,第二个参数不是sync
printf("inputerror!!!\n");
exit(1);
}
else if((fout=open(argv[1],O_RDWR |O_CREAT |O_SYNC|O_TRUNC,FILE_MODE))<0){
printf("openerror!!!\n");
exit(1);
}
}
if((length=lseek(STDIN_FILENO,0,SEEK_END))<0){//用lseek计算文件的长度
printf("Lseek error!\n");
}
if(lseek(STDIN_FILENO,0,SEEK_SET)==-1)//定位到输入文件的开头
{
printf("Lseekerror!\n");
}
printf("\nThe length of file is :%d\n",length);
if((buff=(char *)malloc(sizeof(char)*length))==NULL){//分配给buff长度为输入文件长度的字节
printf("Malloc error\n");//分配不成功返回
exit(1);
}
if(read(STDIN_FILENO,buff,length)<0){//将输入文件读入到buff中
printf("Read error\n");
exit(1);
}
printf("BUFFSIZE\tUSER\t\tSYSTEM\t\tCLOCK\t\tLOOP\n");
for(size=1024;size<=131072;size*=2){//分配给不同的buff不同的长度
lseek(fout,0,SEEK_SET);//重新将文件定位到开头
cstart=times(&sstart);
n=length/size;
loop=0;//loop为计算循环的次数
for(i=1;i<=n;i++,loop++)
if( write(fout,buff+(i-1)*size, size)!=size)//按照不同的size将buff读入到输//出文件中
err_sys("errorwrite!!!\n");
if(write(fout,buff+n*size, length%size)!=length%size)//文件的长度不是size的整数//倍时将剩余的输出到文件中
err_sys("errorawrite!!!\n");
loop++;
cend=times(&send);
dida=sysconf(_SC_CLK_TCK);
ctime=(float)(cend-cstart);//clock
utime=(float)(send.tms_utime -sstart.tms_utime);//usertime
stime=(float)(send.tms_stime -sstart.tms_stime); //system time
printf("%ld\t\t%.2f\t\t%.2f\t\t%.2f\t\t%d\n",size,utime/dida,stime/dida,ctime/dida,loop);
}
printf("\n");
}
计算write耗费的时间
为了准确计算write耗费的时间,很重要的就是要避免将read的时间计入,因为I/O操作的时间通常是毫秒级的,不可以忽略。一种有效的方法是,设置一个与输入文件长度相同的缓冲区,一次性地将输入文件读入缓冲区,而后就不必再读输入文件。这样就可以有效避免计入read的时间。
设置输入缓冲区时需要知道输入文件的长度。除了使用系统调用stat外,更简单的方法是利用lseek的返回值来获取文件的长度。
在对每个给定大小的输出缓冲区计算写文件时间时,应当在开始写之前调用times(),记录下开始时间,然后在整个输入缓冲区都复制到输出文件之后,再调用times(),两次调用times()的时间间隔,就是在这个给定大小的输出缓冲区的限制下,复制整个输入文件所耗费的写时间。至于在每一次写的时候所执行的其他语句,它们相较于I/O操作,所花费的时间极小,可以忽略不计。
四、实验结果
输入gcctimewrite.c error2e.c -o timewrite进行编译。再输入./timewrite <a.jpt 4输出