实验二 同步与异步write的效率比较

               实验二 同步与异步write的效率比较

                                               

一:实验目的

掌握unix的文件I/O系统调用。

二:要求

1.      实验要求程序必须指定输出的文件名,而该文件是否按同步方式打开,则是可以选择的。因此程序至少带一个,至多两个输入参数。程序默认从标准输入STDIN_FILENO读取输入文件,可以利用shell的输入定向功能选择具体的输入文件。

2.     系统调用times()的说明

#include <sys/times.h>

clock_t times(struct tms *buf);

struct tms {

       clock_t tms_utime;    /* 记录进程除系统调用外所使用的CPU时间 */

       clock_t tms_stime;    /* 记录进程的系统调用所使用的CPU时间 */

     clock_t tms_cutime; /* 记录子进程除系统调用外所使用的CPU时间 */

   clock_t tms_cstime; /* 记录子进程的系统调用所使用的CPU时间 */

};

times函数的返回值是进程迄今为止的存活时间。所有时间都是以“滴答”为单位的,函数sysconf(_SC_CLK_TCK)可获得所运行系统每秒的滴答数(参考课本P33)。

 

三.设计和实现的主要原理、构思、算法、执行过程。

1.    将打开的文件的BUFFSIZE大小的块读入缓冲区,循环执行到全部读完,在每次读的过程中调用write进行写操作。

2,  在每次写之前调用时间函数测量一次时间,之后再调用一次时间函数测量时间,两次时间差就是write的写时间,将其记录就得到了write写整个文件的时间。

3,   每次将BUFFSIZE增大两倍,调用lseek函数使文件偏移量在整体读完一次后返回文件头。

 

四.具体的程序如下

#include "apue.h"

#include <sys/times.h>

#include <malloc.h>

#include <fcntl.h>

#include<string.h>

#include<stdio.h>

 

int main(int argc,char *argv[])

{

  int length,n,dida,size,i,fout,loop;

  char *buff;

   clock_t  cstart,cend;

  struct  tms  sstart,send;

  float     utime,stime,ctime;

  if(argc!=2&&argc!=3){

          printf("input error!!\n");

         exit(-1);

   }

  if(argc==2){//当有两个参数的时候,即异步执行时

     if((fout=open(argv[1],O_RDWR | O_CREAT|O_TRUNC,FILE_MODE))<0){

                 printf("openerror!!!\n");

                 exit(1);

                 }

  }

  else if(argc==3){//当有三个参数,即同步执行时

       if(strcmp(argv[2],"sync")!=0){//输入非法,第二个参数不是sync

              printf("inputerror!!!\n");

              exit(1);

      }

  else if((fout=open(argv[1],O_RDWR |O_CREAT |O_SYNC|O_TRUNC,FILE_MODE))<0){

                 printf("openerror!!!\n");

                 exit(1);

                 }                                                        

   }

 if((length=lseek(STDIN_FILENO,0,SEEK_END))<0){//用lseek计算文件的长度

           printf("Lseek error!\n");

   }

  if(lseek(STDIN_FILENO,0,SEEK_SET)==-1)//定位到输入文件的开头

       {

                printf("Lseekerror!\n");

       }

 printf("\nThe length of file is :%d\n",length);

  if((buff=(char *)malloc(sizeof(char)*length))==NULL){//分配给buff长度为输入文件长度的字节

           printf("Malloc  error\n");//分配不成功返回

           exit(1);

  } 

  if(read(STDIN_FILENO,buff,length)<0){//将输入文件读入到buff中

       printf("Read error\n");

       exit(1);

  }     

  printf("BUFFSIZE\tUSER\t\tSYSTEM\t\tCLOCK\t\tLOOP\n");

  for(size=1024;size<=131072;size*=2){//分配给不同的buff不同的长度

          lseek(fout,0,SEEK_SET);//重新将文件定位到开头

          cstart=times(&sstart);

          n=length/size;

          loop=0;//loop为计算循环的次数

          for(i=1;i<=n;i++,loop++)

               if( write(fout,buff+(i-1)*size, size)!=size)//按照不同的size将buff读入到输//出文件中

                       err_sys("errorwrite!!!\n");

                      

        if(write(fout,buff+n*size, length%size)!=length%size)//文件的长度不是size的整数//倍时将剩余的输出到文件中

                       err_sys("errorawrite!!!\n");

        loop++;                                 

        cend=times(&send);

        dida=sysconf(_SC_CLK_TCK);

        ctime=(float)(cend-cstart);//clock 

        utime=(float)(send.tms_utime -sstart.tms_utime);//usertime

        stime=(float)(send.tms_stime -sstart.tms_stime); //system time

        printf("%ld\t\t%.2f\t\t%.2f\t\t%.2f\t\t%d\n",size,utime/dida,stime/dida,ctime/dida,loop); 

    

   }

 printf("\n");               

}     

          

计算write耗费的时间

为了准确计算write耗费的时间,很重要的就是要避免将read的时间计入,因为I/O操作的时间通常是毫秒级的,不可以忽略。一种有效的方法是,设置一个与输入文件长度相同的缓冲区,一次性地将输入文件读入缓冲区,而后就不必再读输入文件。这样就可以有效避免计入read的时间。

 

设置输入缓冲区时需要知道输入文件的长度。除了使用系统调用stat外,更简单的方法是利用lseek的返回值来获取文件的长度。

 

在对每个给定大小的输出缓冲区计算写文件时间时,应当在开始写之前调用times(),记录下开始时间,然后在整个输入缓冲区都复制到输出文件之后,再调用times(),两次调用times()的时间间隔,就是在这个给定大小的输出缓冲区的限制下,复制整个输入文件所耗费的写时间。至于在每一次写的时候所执行的其他语句,它们相较于I/O操作,所花费的时间极小,可以忽略不计。

 

四、实验结果

输入gcctimewrite.c error2e.c -o timewrite进行编译。再输入./timewrite <a.jpt 4输出


 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1、程序的参数和输入 实验要求程序必须指定输出的文件名,而该文件是否按同步方式打开,则是可以选择的。因此程序至少带一个、至多两个输入参数。程序默认从标准输入STDIN_FILENO读取输入文件,可以利用shell的输入定向功能选择具体的输入文件。 系统调用times()的说明 #include <sys/times.h> clock_t times(struct tms *buf); struct tms { clock_t tms_utime; /* 记录进程除系统调用外所使用的CPU时间 */ clock_t tms_stime; /* 记录进程的系统调用所使用的CPU时间 */ clock_t tms_cutime; /* 记录子进程除系统调用外所使用的CPU时间 */ clock_t tms_cstime; /* 记录子进程的系统调用所使用的CPU时间 */ }; times函数的返回值是进程迄今为止的存活时间。所有时间都是以“滴答”为单位的,函数 sysconf(_SC_CLK_TCK)可获得所运行系统每秒的滴答数(参考课本P33)。 3、计算write耗费的时间 为了准确计算write耗费的时间,很重要的就是要避免将read的时间计入,因为I/O操作的时间通常是毫秒级的,不可以忽略。一种有效的方法是,设置一个与输入文件长度相同的缓冲区,一次性地将输入文件读入缓冲区,而后就不必再读输入文件。这样就可以有效避免计入read的时间。 有同学可能会问,难道可以在内存中创建一个几十上百兆乃至上G的缓冲区吗?回答是没问题!因为我们所运行的操作系统系统具有虚拟存储管理功能。 设置输入缓冲区时需要知道输入文件的长度。除了使用系统调用stat外,更简单的方法是利用lseek的返回值来获取文件的长度。 在按每一个给定大小的输出缓冲区计算写文件时间时,应当在开始写之前调用times(),记录下开始时间,然后在整个输入缓冲区都复制到输出文件之后,再调用times(),两次调用times()的时间间隔,就是在这个给定大小的输出缓冲区的限制下,复制整个输入文件所耗费的写时间。至于在每一次写的时候所执行的其他语句,它们相较于I/O操作,所花费的时间极小,可以忽略不计。 注意,在开始按一个给定大小的输出缓冲区复制输入文件时,应当先将输出文件的写位置复位到输出文件的开头(这意味着不能以O_APPEND方式打开输出文件)。可以使用lseek做到这一点,以避免多次打开、关闭输出文件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值