python进行文件读写的函数是open或file
file_handler = open(filename,,mode)
Table mode
模mode
details
r
以读方式打开文件,可读取文件信息,默认不写为r模式。
w
以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容
a
以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建
r+
以读写方式打开文件,可对文件进行读和写操作。
w+
消除文件内容,然后以读写方式打开文件。
a+
以读写方式打开文件,并把文件指针移到文件尾。
b
以二进制模式打开文件,而不是以文本模式。该模式只对Windows或Dos有效,类Unix的文件是用二进制模式进行操作的。
Table文件对象方法
方法
描述
f.close()
关闭文件,记住用open()打开文件后一定要记得关闭它,否则会占用系统的可打开文件句柄数。
f.fileno()
获得文件描述符,是一个数字
f.flush()
刷新输出缓存
f.isatty()
如果文件是一个交互终端,则返回True,否则返回False。
f.read([count])
读出文件,如果有count,则读出count个字节。
f.readline()
读出一行信息。
f.readlines()
读出所有行,也就是读出整个文件的信息。
f.seek(offset[,where])
把文件指针移动到相对于where的offset位置。where为0表示文件开始处,这是默认值 ;1表示当前位置;2表示文件结尾。
f.tell()
获得文件指针位置。
f.truncate([size])
截取文件,使文件的大小为size。
f.write(string)
把string字符串写入文件。
f.writelines(list)
把list中的字符串一行一行地写入文件,是连续写入文件,没有换行。
例子如下: 读文件
read = open(result) line=read.readline() while line: print line line=read.readline()#如果没有这行会造成死循环 read.close
写文件
read = file(result,'a+') read.write("\r\n") read.write("thank you") read.close
其他
#-*- encoding:UTF-8 -*- filehandler = open('c:\\111.txt','r') #以读方式打开文件,rb为二进制方式(如图片或可执行文件等) print 'read() function:' #读取整个文件 print filehandler.read() print 'readline() function:' #返回文件头,读取一行 filehandler.seek(0) print filehandler.readline() print 'readlines() function:' #返回文件头,返回所有行的列表 filehandler.seek(0) print filehandler.readlines() print 'list all lines' #返回文件头,显示所有行 filehandler.seek(0) textlist = filehandler.readlines() for line in textlist: print line, print print print 'seek(15) function' #移位到第15个字符,从16个字符开始显示余下内容 filehandler.seek(15) print 'tell() function' print filehandler.tell() #显示当前位置 print filehandler.read() filehandler.close() #关闭文件句柄
文件替换并保存到另一个文件:
#!/usr/bin/python fp1 = file("a.t","r") fp2 = file("a2.t","w") for s in f1.readlines(): fp2.write(s.replace("hello","bye")) fp1.close() fp2.close()
文件替换并覆盖本文件:
#!/usr/bin/python fp1 = file("a.txt","r+") s = fp1.read() f1.seek(0,0) f1.write(s.replace("hello","bye")) fp1.close()
python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。
得到当前工作目录,即当前Python脚本工作的目录路径:os.getcwd()
返回指定目录下的所有文件和目录名:os.listdir()
创建多级目录:os.makedirs(name,mode=511)
创建单个目录:os.mkdir(path[,mode=0777])
函数用来删除一个文件:os.remove()
删除多个目录:os.removedirs(r“c:\python”)
检验给出的路径是否是一个文件:os.path.isfile()
检验给出的路径是否是一个目录:os.path.isdir()
判断是否是绝对路径:os.path.isabs()
检验给出的路径是否真的存在:os.path.exists()
返回一个路径的目录名和文件名:os.path.split()
eg os.path.split('/home/swaroop/byte/code/poem.txt') 结果:('/home/swaroop/byte/code', 'poem.txt')
分离扩展名:os.path.splitext()
获取路径名:os.path.dirname()
获取文件名:os.path.basename()
运行shell命令:os.system()
读取和设置环境变量:os.getenv() 与os.putenv()
给出当前平台使用的行终止符:os.linesepWindows使用'\r\n',Linux使用'\n'而Mac使用'\r'
指示你正在使用的平台:os.name对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'
重命名:os.rename(old, new)
获取文件属性:os.stat(file)
修改文件权限与时间戳:os.chmod(file)
终止当前进程:os.exit()
获取文件大小:os.path.getsize(filename)
文件操作:
os.mknod("test.txt")创建空文件
fp = open("test.txt",w)直接打开一个文件,如果文件不存在则创建文件
关于open 模式:
w 以写方式打开,
a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)
r+ 以读写模式打开
w+ 以读写模式打开 (参见 w )
a+ 以读写模式打开 (参见 a )
rb 以二进制读模式打开
wb 以二进制写模式打开 (参见 w )
ab 以二进制追加模式打开 (参见 a )
rb+ 以二进制读写模式打开 (参见 r+ )
wb+ 以二进制读写模式打开 (参见 w+ )
ab+ 以二进制读写模式打开 (参见 a+ )
fp.read([size])#size为读取的长度,以byte为单位
fp.readline([size])#读一行,如果定义了size,有可能返回的只是一行的一部分
fp.readlines([size])#把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
fp.write(str)#把str写到文件中,write()并不会在str后加上一个换行符
fp.writelines(seq)#把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
fp.close()#关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。 如果一个文件在关闭后还对其进行操作会产生ValueError
fp.flush()#把缓冲区的内容写入硬盘
fp.fileno() #返回一个长整型的”文件标签“
fp.isatty() #文件是否是一个终端设备文件(unix系统中的)
fp.tell() #返回文件操作标记的当前位置,以文件的开头为原点
fp.next()#返回下一行,并将文件操作标记位移到下一行,读完后有提示。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
fp.seek(offset[,whence])#将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
fp.truncate([size]) #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。
目录操作:
创建单个目录:os.mkdir(path[,mode=0777])
创建多级目录:os.makedirs(name,mode=511)
os.rmdir(path) 只能删除空目录
os.removedirs(path) 删除多级目录
os.listdir(dirname) 列出dirname下的目录和文件
os.getcwd() 获得当前工作目录
os.chdir(path)换路径
复制文件:
shutil.copyfile("oldfile","newfile")
oldfile和newfile都只能是文件
shutil.copy("oldfile","newfile")
oldfile只能是文件夹,newfile可以是文件,也可以是目标目录
复制文件夹:
shutil.copytree("olddir","newdir")
olddir和newdir都只能是目录,且newdir必须不存在
重命名文件(目录)
os.rename("oldname","newname")
文件或目录都是使用这条命令
移动文件(目录)
shutil.move("oldpos","newpos")
删除文件
os.remove("file")
shutil.rmtree("dir")空目录、有内容的目录都可以删
目录遍历:
直接的 API如:os.walk,os.path.walk,也可以通过os.listdir()然后循环遍历os.walk方法需要理解一下其返回值 返回一个大概如 [('C://",['System','Program','Windows','Temp'],['sys.page','a.txt']),...]
的迭代对象,每个元素是一个Tuple对象,每个Tuple的第一个值可以理解为当前目录,第二个是一个数组的东西,表示当前目录下所有的文件夹名字,第三个也是一个数组对象,表示当前文件夹下面所有的文件名字。还可以用os.path.walk方法,该函数需要一个回调函数基本和os.walk差不多
相关例子
1 遍历目录-列出目录下的所有文件的绝对路径
#!/usr/bin/python #coding:utf8 import os def dirList(path):#递归方法实现 filelist = os.listdir(path) for filename in filelist: filepath = os.path.join(path,filename) if os.path.isdir(filepath): dirList(filepath) print filepath dirList('/home') for path.d.filelist in os.walk('/home'):#使用walk方法 for filename in filelist: os.path.join(path,filename)
2将文件夹下所有图片名称加上'_fc'
# -*- coding:utf-8 -*-
import re
import os
import time
#str.split(string)分割字符串
#'连接符'.join(list) 将列表组成字符串
def change_name(path):
global i
if not os.path.isdir(path) and not os.path.isfile(path):
return False
if os.path.isfile(path):
file_path = os.path.split(path) #分割出目录与文件
lists = file_path[1].split('.') #分割出文件与文件扩展名
file_ext = lists[-1] #取出后缀名(列表切片操作)
img_ext = ['bmp','jpeg','gif','psd','png','jpg']
if file_ext in img_ext:
os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
i+=1 #注意这里的i是一个陷阱
#或者
#img_ext = 'bmp|jpeg|gif|psd|png|jpg'
#if file_ext in img_ext:
# print('ok---'+file_ext)
elif os.path.isdir(path):
for x in os.listdir(path):
change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
img_dir = 'D:\\xx\\xx\\images'
img_dir = img_dir.replace('\\','/')
start = time.time()
i = 0
change_name(img_dir)
c = time.time() - start
print('程序运行耗时:%0.2f'%(c))
print('总共处理了 %s 张图片'%(i))
输出结果:
程序运行耗时:0.11
总共处理了 109 张图片