#!/usr/bin/python
#-*- coding: utf-8 -*-
#图片中有大量冗余数据,需要删除,现在有开发跑出有用的图片,并且按照每天生产.txt 文件
#1.遍历按天生产.txt文件,新建一个新的目录,将有用文件都移动到此目录下。让后新老目录名兑换
#样列:http://test.xx.com/v0/app-feed/soft/apk/201202/20120224164134.apk
import os
import shutil
rootdir="/root/python/apk"
apknewdir="/www/v0/app-feed/soft/apknew1"
#开始遍历文件
for parent,dirnames,filenames in os.walk(rootdir):
        
    for filename in filenames:
        file_object= open(os.path.join(rootdir,filename),'r')
        try:
            list_of_all_the_lines=file_object.readlines()
            for line in list_of_all_the_lines:
                #使用截取字符串,拼接文件名
                #apkfilename="/www/"+line.split("/",3)[3]
                #通过字符串替换 得到文件名
                apkfilename=line.replace("http://test.xx.com","/www")
                #apkfilename="/www/v0/app-feed/soft/apk/201202/20120224164134.apk" 取文件名
                datedir=apkfilename.split("/",7)[6]
                #datedir="201202" 取时间
                #判断日期文件夹是否存在,如果不存在就创建,否则就复制文件到新的目录中
                if os.path.exists(os.path.join(apknewdir,datedir)):
                    #shutil.copy(apkfilename,os.path.join(apknewdir,datedir))
                    print(apkfilename+"_____"+os.path.join(apknewdir,datedir))
                else :
                    os.path.mkdir(os.path.join(apknewdir,datedir))
                    #print("create"+os.path.join(apknewdir,datedir))
                            
        finally:
            file_object.close()