文件处理:
读文件:
f1 = file("D:\\document_classification\\sports_urlFilePair.txt",'r')
while True:
line = f1.readline()
if(line == "\n" or line == ""):
break
tmp = line.split("\t")
写文件:
f2 = file("D:\\document_classification\\sports.txt","w")
f2.write()
目录处理:
读取目录下的文件名称及路径:
for i in os.listdir(directory):
string = directory+"\\"+i
新建目录:
if(not os.path.exists(infoPageDirectory+ngram)):
os.mkdir(infoPageDirectory+ngram)
判断文件/目录是否存在:
import os
os.path.isfile('test.txt') #如果不存在就返回False os.path.exists(directory) #如果目录不存在就返回False |
中文编码:
import sys
reload(sys)
sys.setdefaultencoding('utf8')
line = line.decode("UTF-8")
len(line)
以参数输入输出:
import sys
reload(sys)
args = sys.argv
#input file
source = file(args[1],"r")
#output file
output = file(args[2],"w")