目录
文件操作
用Python创建一个新文件
内容是从0到9的整数, 每个数字占一行:
f=open('f.txt','w') # r只读,w可写,a追加
for i in range(0,10):f.write(str(i)+'\n')
f.close()
try:
f=open('f.txt','r') # r只读,w可写,a追加
t=f.readlines()
print(t)
f.close()
except Exception,e:
f.close()
文件内容追加,从0到9的10个随机整数
import random
f=open('f.txt','a')
for i in range(0,10):f.write(str(random.randint(0,9)))
f.write('\n')
f.close()
文件内容追加,从0到9的随机整数, 10个数字一行,共10行
import random
f=open('f.txt','a')
for i in range(0,10):
for i in range(0,10):f.write(str(random.randint(0,9)))
f.write('\n')
f.close()
如何读取并显示
g=open('f.txt','rt') # r只读,w可写,a追加
s=g.readlines()
print(s)
for i in range(len(s)):
s[i]=s[i].strip('\n')
print(s)
g.close()
把标准输出定向到文件
#python
import sys
sys.stdout = open("stdout.txt", "w")
文件的读写
文件打开
f = file(name[, mode[, buffering]])
入口参数: name 文件名
mode 选项,字符串
buffering 是否缓冲 (0=不缓冲,1=缓冲, >1的int数=缓冲区大小)
返回值 : 文件对象
mode 选项:
"r" 以读方式打开,只能读文件 , 如果文件不存在,会发生异常
"w" 以写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件
"rb" 以二进制读方式打开,只能读文件 , 如果文件不存在,会发生异常
"wb" 以二进制写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件。
"rt" 以文本读方式打开,只能读文件 , 如果文件不存在,会发生异常。
"wt" 以文本写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件
"rb+" 以二进制读方式打开,可以读、写文件 , 如果文件不存在,会发生异常。
"wb+" 以二进制写方式打开,可以读、写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件
关闭文件
f.close()
当文件读写完毕后,应关闭文件。
清空文件内容
f.truncate()
注意:仅当以 "r+" "rb+" "w" "wb" "wb+"等以可写模式打开的文件才可以执行该功能。
文件的指针定位与查询
- 文件指针:
文件被打开后,其对象保存在 f 中, 它会记住文件的当前位置,以便于执行读、写操作,这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。
- 文件打开时的位置:
以"r" "r+" "rb+" 读方式, "w" "w+" "wb+"写方式 打开的文件,一开始,文件指针均指向文件的头部。
- 获取文件指针的值: L = f.tell()
- 移动文件的指针
f.seek(偏移量, 选项)
选项 =0 时, 表示将文件指针指向从文件头部到 "偏移量"字节处。
选项 =1 时, 表示将文件指针指向从文件的当前位置,向后移动 "偏移量"字节。
选项 =2 时, 表示将文件指针指向从文件的尾部,,向前移动 "偏移量"字节。
从文件读取指内容
1 文本文件(以"rt"方式打开的文件)的读取
s = f.readline()
返回值:s 是字符串,从文件中读取的一行,含行结束符。
说明: (1) 如果 len( s ) =0 表示已到文件尾
(2) 如果是文件的最后一行,有可能没有行结束符
2 二进制文件(以"rb"、"rb+"、"wb+" 方式打开的文件)的读取
说明: (1) 如果 len( s ) =0 表示已到文件尾
(2) 文件读取后,文件的指针向后移动 len(s) 字节。
(3) 如果磁道已坏,会发生异常。
向文件写入一个字符串
f.write( s )
参数: s 要写入的字符串
说明:(1)文件写入后,文件的指针向后移动 len(s) 字节。
(2)如果磁道已坏,或磁盘已满会发生异常。
返回值:s 是字符串,从文件中读取的内容
删除文件
import os
os.remove(file)
打开文件
读写文件之前,先用open()函数打开一个文件,它会返回一个文件对象(file object):
f =open(filename,mode)
如果不指定mode参数,文件将默认以‘r'模式打开。模式中的字符有:
r:只读
w:只写,如果文件已存在则将其覆盖。如果该文件不存在,创建新文件
+:读写(不能单独使用)
a:打开文件用于追加,只写,不存在则创建新文件
b:以二进制模式打开(不能单独使用)
所以可能的模式大概有r、w、r+、w+、rb、wb、rb+、wb+、a、a+、ab、ab+,注意只有w和a可以创建文件。
通常情况下,文件都是以文本模式(text mode)打开的,也就是说,从文件中读写的是以一种特定的编码格式进行编码(默认的是 UTF-8)的字符串。如果文件以二进制模式(binary mode)打开,数据将以字节对象的形式进行读写:
f =open('a.txt','wb+')
f.write('I like apple!') # 报错
f.write(b'I like apple!') # 以bytes对象的形式进行读写
Bytes对象是0到127的不可修改的整数序列,或纯粹的 ASCII 字符,它的用途是存储二进制数据。
可以通过在一个字符串前面加上'b'来创建一个bytes literal;
也可以通过bytes() 函数创建一个 bytes 对象。
注意:如果bytes() 函数的初始化器是一个字符串,那么必须提供一种编码。
b1 =b'This is string'
b2 =bytes('This is string', 'UTF-8') # 必须指定编码格式
字符串对象与字节对象是不兼容的,要将 bytes 转变为 str, bytes 对象必须要进行解码,使用decode() 方法:
b = bytes('This is string', 'UTF-8')
print(b, b.decode(), sep='\n')
# 输出:
# b'This is string'
# This is string
文件对象的方法(假设f是一个文件对象):
f.read(size) :读取size个字节的数据,然后作为字符串或 bytes 对象返回。size是一个可选参数,如果不指定size,则读取文件的所有内容。
f.readline() :读取一行。在字符串末尾会留下换行符 (\n),如果到文件尾,返回空字符串。
f.readlines() :读取所有行,储存在列表中,每个元素是一行,相当于list(f)。
f.write(string) :将 string 写入到文件中,返回写入的字符数。如果以二进制模式写文件,需要将string转换为 bytes 对象。
f.tell() :返回文件对象当前所处的位置,它是从文件开头开始算起的字节数。
f.seek(offset, from_what) :改变文件对象所处的位置。offset是相对参考位置的偏移量,from_what 取值 0(文件头, 默认)、1(当前位置)、2(文件尾)表示参考位置。
f.close() :关闭文件对象。
这些都是很常用的方法,当然文件对象不止这些方法。根据打开的模式不同,open() 返回的文件对象类型也不同:
TextIOWrapper:文本模式,返回TextIOWrapper对象。
BufferedReader:读二进制,即rb,返回BufferedReader对象。
BufferedWriter:写和追加二进制,即wb、ab,返回BufferedWriter对象。
BufferedRandom:读/写模式,即含有+的模式,返回BufferedRandom对象。
可以在这些文件对象上运行 dir() 或 help(),查看它们所有的方法。
操作函数目录
对文件、文件夹的操作
需要涉及到os模块和shutil模块。
(1)得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()
(2)返回指定目录下的所有文件和目录名:os.listdir()
(3)函数用来删除一个文件:os.remove()
(4)删除多个目录:os.removedirs(r"c:\python")
(5)检验给出的路径是否是一个文件:os.path.isfile()
(6)检验给出的路径是否是一个目录:os.path.isdir()
(7)判断是否是绝对路径:os.path.isabs()
(8)检验给出的路径是否真地存:os.path.exists()
(9)返回一个路径的目录名和文件名:
os.path.split()
例如:
os.path.split('/home/swaroop/byte/code/poem.txt')
结果:
('/home/swaroop/byte/code', 'poem.txt')
(10)分离扩展名:os.path.splitext()
>>> t=os.path.splitext("d:\d.txt")
>>> t[0]
'd:\\d'
>>> t[1]
'.txt'
(11)获取路径名:os.path.dirname()
(12)获取文件名:os.path.basename()
(12)运行shell命令: os.system()
(13)读取和设置环境变量:os.getenv() 与os.putenv()
(14)给出当前平台使用的行终止符:os.linesep
Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'
指示你正在使用的平台:os.name对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'
(15)重命名:os.rename(old, new)
(16)创建多级目录:os.makedirs(r"c:\python\test")
(17)创建单个目录:os.mkdir("test")
(18)获取文件属性:os.stat(file)
(19)修改文件权限与时间戳:os.chmod(file)
(20)终止当前进程:os.exit()
(21)获取文件大小:os.path.getsize(filename)
文件操作
os.mknod("test.txt") 创建空文件
fp = open("test.txt", 'w') 直接打开一个文件,如果文件不存在则创建文件
关于open 模式:
w 以写方式打开,
a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+ 以读写模式打开
w+ 以读写模式打开 (参见 w )
a+ 以读写模式打开 (参见 a )
rb 以二进制读模式打开
wb 以二进制写模式打开 (参见 w )
ab 以二进制追加模式打开 (参见 a )
rb+ 以二进制读写模式打开 (参见 r+ )
wb+ 以二进制读写模式打开 (参见 w+ )
ab+ 以二进制读写模式打开 (参见 a+ )
fp.read([size]) #size为读取的长度,以byte为单位
fp.readline([size]) #读一行,如果定义了size,有可能返回的只是一行的一部分
fp.readlines([size]) #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
fp.write(str) #把str写到文件中,write()并不会在str后加上一个换行符
fp.writelines(seq) #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
fp.close() #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError
fp.flush() #把缓冲区的内容写入硬盘
fp.fileno() #返回一个长整型的"文件标签"
fp.isatty() #文件是否是一个终端设备文件(unix系统中的)
fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点
fp.next() #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
fp.seek(offset[,whence]) #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
fp.truncate([size]) #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
目录操作
import shutil
shutil -- High-level file operations 是一种高层次的文件操作工具
类似于高级API,而且主要强大之处在于其对文件的复制与删除操作。
(1)创建目录os.mkdir("file")
(2)复制文件:
shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile") oldfile只能是文件夹,newfile可以是文件,也可以是目标目录
(3)复制文件夹:
shutil.copytree("olddir","newdir") olddir和newdir都只能是目录,且newdir必须不存在
(4)重命名文件(目录)
os.rename("oldname","newname") 文件或目录都是使用这条命令
(5)移动文件(目录)
shutil.move("oldpos","newpos")
(6)删除文件
os.remove("file")
(7)删除目录
os.rmdir("dir")只能删除空目录
shutil.rmtree("dir") 空目录、有内容的目录都可以删
(8)转换目录
os.chdir("path") 换路径
Example:
(使用os.listdir)
import os
def ListFilesToTxt(dir,file,wildcard,recursion):
exts = wildcard.split(" ")
files = os.listdir(dir)
for name in files:
fullname=os.path.join(dir,name)
if(os.path.isdir(fullname) & recursion):
ListFilesToTxt(fullname,file,wildcard,recursion)
else:
for ext in exts:
if(name.endswith(ext)):
file.write(name + "\n")
break
def Test():
dir="/datas/Pdata"
outfile="binaries.txt"
wildcard = ".txt .exe .dll .lib"
file = open(outfile,"w")
if not file:
print ("cannot open the file %s for writing" % outfile)
ListFilesToTxt(dir,file,wildcard, 1)
file.close()
Test()
代码:(使用os.walk) walk递归地对目录及子目录处理,每次返回的三项分别为:当前递归的目录,当前递归的目录下的所有子目录,当前递归的目录下的所有文件。
import os
def ListFilesToTxt(dir,file,wildcard,recursion):
exts = wildcard.split(" ")
for root, subdirs, files in os.walk(dir):
for name in files:
for ext in exts:
if(name.endswith(ext)):
file.write(name + "\n")
break
if(not recursion):
break
def Test():
dir="/datas/Pdata"
outfile="binaries.txt"
wildcard = ".txt .exe .dll .lib"
file = open(outfile,"w")
if not file:
print ("cannot open the file %s for writing" % outfile)
ListFilesToTxt(dir,file,wildcard, 0)
file.close()
Test()
运行结果:
案例
将文件夹下所有图片名称加上'_fc'
python代码:
# -*- coding:utf-8 -*-
import re
import os
import time
#str.split(string)分割字符串
#'连接符'.join(list) 将列表组成字符串
def change_name(path):
global i
if not os.path.isdir(path) and not os.path.isfile(path):
return False
if os.path.isfile(path):
file_path = os.path.split(path) #分割出目录与文件
lists = file_path[1].split('.') #分割出文件与文件扩展名
file_ext = lists[-1] #取出后缀名(列表切片操作)
img_ext = ['bmp','jpeg','gif','psd','png','jpg']
if file_ext in img_ext:
os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
i+=1 #注意这里的i是一个陷阱
#或者
#img_ext = 'bmp|jpeg|gif|psd|png|jpg'
#if file_ext in img_ext:
# print('ok---'+file_ext)
elif os.path.isdir(path):
for x in os.listdir(path):
change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
img_dir = 'D:\\xx\\xx\\images'
img_dir = img_dir.replace('\\','/')
start = time.time()
i = 0
change_name(img_dir)
c = time.time() - start
print('程序运行耗时:%0.2f'%(c))
print('总共处理了 %s 张图片'%(i))
输出结果:
图片改名结果: