Shell使用系统tar

Python使用tarfile模块,Python不开多线程的情况两者做文件打包压缩对比。

Shell代码

 

 
  
  1. #!/bin/sh - 
  2. # Bak_rsync_Shell.sh version 
  3.  
  4. shell_dir=`pwd` 
  5. src_dir=/data/rsync_center 
  6. bak_dir="/data/backup/game/test" 
  7. log_file=${shell_dir}/rsync_center_bak.log 
  8. Version=$1 
  9. Today=`/bin/date +%Y_%m_%d` 
  10. Fourteenday=`/bin/date -v -8d +%Y_%m_%d` 
  11. bak_file="rsync_center_${Today}_${Version}.tgz" 
  12. md5_file=${shell_dir}/md5/$bak_file.md5 
  13.  
  14. if [ $# -ne 1 ] 
  15.         then    echo "Please give a version!" 
  16.                 break 
  17. else 
  18.         startdate=`date "+%Y-%m-%d %H:%M:%S"` 
  19.         echo "rsync_center backup Start  at " $startdate 
  20.         cd $src_dir 
  21.         tar -zcf $bak_file ./ 
  22.         /sbin/md5 $bak_file > $md5_file 
  23.         mv $bak_file $bak_dir/ 
  24.         enddate=`date "+%Y-%m-%d %H:%M:%S"` 
  25.         echo "rsync_center backup Complete at" $enddate 
  26. fi 

Python代码

 

 
  
  1. #-*- coding: utf-8 -*- 
  2. #!/usr/bin/evn python 
  3. """ 
  4. USAGE: 
  5.         Bak_rsync_Python.py version 
  6. """ 
  7. import sys 
  8. import time 
  9. import os 
  10. import shutil 
  11. import subprocess 
  12. import tarfile 
  13.  
  14. rundir=os.getcwd() 
  15. src_dir='/data/rsync_center' 
  16. bak_dir='/data/backup/game/test' 
  17. today=time.strftime("%Y_%m_%d", time.localtime()) 
  18.  
  19. def main(version): 
  20.         #set local var 
  21.         md5="/sbin/md5" 
  22.         bak_file="rsync_center_"+today+"_"+version+".tgz" #多个变量联合做变量 
  23.         md5_file=rundir+"/md5/"+bak_file+".md5" 
  24.         cmd="%s %s > %s" % (md5,bak_file,md5_file)     
  25.         #print bak_file 
  26.         #print md5_file 
  27.  
  28.         #tar src dir 
  29.         os.chdir(src_dir) 
  30.         tar=tarfile.open(bak_file,'w|gz') 
  31.         tar.add(src_dir) 
  32.         tar.close() 
  33.  
  34.         #tgz file md5 
  35.         ret=subprocess.call(cmd,shell=True) #subprocess.call返回值是退出状态 
  36.         if ret !=0:              
  37.                 print "md5 failed" 
  38.                 sys.exit(1) 
  39.         #else: print ret 
  40.  
  41.         #move tgz to dst dir 
  42.         shutil.move(bak_file,bak_dir) 
  43.  
  44.  
  45. if __name__=='__main__': 
  46.         try: 
  47.                 len(sys.argv)!=2 
  48.         except: 
  49.                 print "Please give version" 
  50.                 print __doc__ 
  51.         else: 
  52.                 print "start at",time.ctime() 
  53.                 version=sys.argv[1] 
  54.                 main(version) 
  55.                 print "end at",time.ctime() 

 

运行对比:

#du -sh /data/rsync_center/
112M    /data/rsync_center/
#sh Bak_rsync_Shell.sh testShell
rsync_center backup Start  at  2012-03-15 14:53:37
tar: ./rsync_center_2012_03_15_testShell.tgz: Can't add archive to itself
rsync_center backup Complete at 2012-03-15 14:53:46
使用了9秒

#python Bak_rsync_Python.py testPython
start at Thu Mar 15 14:54:54 2012
end at Thu Mar 15 14:55:20 2012
使用了27秒

压缩大小差不多
#ll -h /data/backup/game/test/ | awk '{print$5,$9}'
49M rsync_center_2012_03_15_testPython.tgz
49M rsync_center_2012_03_15_testShell.tgz

python使用代码53行(取出注释也有40行),shell使用代码26行

python的逻辑更复杂,shell更简单一点。

 

可见python在单线程的情况下,对于系统基本文件处理,比如复制移动,打包压缩不如shell简单高效。逻辑上也不利于SA快速理解。所以,Python在基本的系统管理上,可能不如Shell.