Python 文件操作

 

 

目录

 

文件操作

用Python创建一个新文件

文件内容追加,从0到9的10个随机整数

如何读取并显示

把标准输出定向到文件

文件的读写

文件打开

关闭文件

清空文件内容

文件的指针定位与查询

从文件读取指内容

向文件写入一个字符串

删除文件

打开文件

操作函数目录

对文件、文件夹的操作

文件操作

目录操作

案例


文件操作

用Python创建一个新文件

内容是从0到9的整数, 每个数字占一行:

f=open('f.txt','w')    # r只读,w可写,a追加
for i in range(0,10):f.write(str(i)+'\n')
f.close()
try:
f=open('f.txt','r')    # r只读,w可写,a追加
t=f.readlines()
print(t)
f.close()
  except Exception,e:
    f.close()

文件内容追加,从0到9的10个随机整数

import random
f=open('f.txt','a')
for i in range(0,10):f.write(str(random.randint(0,9)))
f.write('\n')
f.close()

 

文件内容追加,从0到9的随机整数, 10个数字一行,共10行

import random
f=open('f.txt','a')
for i in range(0,10):
     for i in range(0,10):f.write(str(random.randint(0,9)))
     f.write('\n')
f.close()

 

如何读取并显示

g=open('f.txt','rt')    # r只读,w可写,a追加
s=g.readlines()
print(s)
for i in range(len(s)):
    s[i]=s[i].strip('\n')
print(s)
g.close()

把标准输出定向到文件

#python

import sys

sys.stdout = open("stdout.txt", "w")

 

 

文件的读写

文件打开

f = file(name[, mode[, buffering]])

入口参数:   name 文件名

           mode   选项,字符串

           buffering   是否缓冲 (0=不缓冲,1=缓冲, >1的int数=缓冲区大小)

返回值 : 文件对象

mode 选项:

"r"   以读方式打开,只能读文件 , 如果文件不存在,会发生异常    

"w" 以写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

"rb"   以二进制读方式打开,只能读文件 , 如果文件不存在,会发生异常

"wb" 以二进制写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件。

"rt"   以文本读方式打开,只能读文件 , 如果文件不存在,会发生异常。

"wt" 以文本写方式打开,只能写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

"rb+"   以二进制读方式打开,可以读、写文件 , 如果文件不存在,会发生异常。

"wb+" 以二进制写方式打开,可以读、写文件, 如果文件不存在,创建该文件。如果文件已存在,先清空,再打开文件

关闭文件

f.close()

当文件读写完毕后,应关闭文件。

清空文件内容

f.truncate()

注意:仅当以 "r+"   "rb+"    "w"   "wb" "wb+"等以可写模式打开的文件才可以执行该功能。

文件的指针定位与查询

  1. 文件指针:

文件被打开后,其对象保存在 f 中, 它会记住文件的当前位置,以便于执行读、写操作,这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

  1. 文件打开时的位置:

以"r"   "r+"   "rb+" 读方式, "w"   "w+"   "wb+"写方式 打开的文件,一开始,文件指针均指向文件的头部。

  1. 获取文件指针的值: L = f.tell()
  2. 移动文件的指针

f.seek(偏移量, 选项)

选项 =0 时, 表示将文件指针指向从文件头部到 "偏移量"字节处。

选项 =1 时, 表示将文件指针指向从文件的当前位置,向后移动 "偏移量"字节。

选项 =2 时, 表示将文件指针指向从文件的尾部,,向前移动 "偏移量"字节。

从文件读取指内容

1 文本文件(以"rt"方式打开的文件)的读取

          s = f.readline()

返回值:s 是字符串,从文件中读取的一行,含行结束符。

说明: (1)  如果 len( s ) =0 表示已到文件尾

 (2)  如果是文件的最后一行,有可能没有行结束符

2 二进制文件(以"rb"、"rb+"、"wb+" 方式打开的文件)的读取

说明: (1)  如果 len( s ) =0 表示已到文件尾

       (2)  文件读取后,文件的指针向后移动 len(s) 字节。

       (3)  如果磁道已坏,会发生异常。

向文件写入一个字符串

 

   f.write( s )

参数: s 要写入的字符串

说明:(1)文件写入后,文件的指针向后移动 len(s) 字节。

      (2)如果磁道已坏,或磁盘已满会发生异常。

返回值:s 是字符串,从文件中读取的内容

删除文件

import os

os.remove(file)

 

 

打开文件

读写文件之前,先用open()函数打开一个文件,它会返回一个文件对象(file object):

f =open(filename,mode)

如果不指定mode参数,文件将默认以‘r'模式打开。模式中的字符有:

r:只读

w:只写,如果文件已存在则将其覆盖。如果该文件不存在,创建新文件

+:读写(不能单独使用)

a:打开文件用于追加,只写,不存在则创建新文件

b:以二进制模式打开(不能单独使用)

所以可能的模式大概有r、w、r+、w+、rb、wb、rb+、wb+、a、a+、ab、ab+,注意只有w和a可以创建文件。

通常情况下,文件都是以文本模式(text mode)打开的,也就是说,从文件中读写的是以一种特定的编码格式进行编码(默认的是 UTF-8)的字符串。如果文件以二进制模式(binary mode)打开,数据将以字节对象的形式进行读写:

f =open('a.txt','wb+')

f.write('I like apple!')  # 报错

f.write(b'I like apple!') # 以bytes对象的形式进行读写

Bytes对象是0到127的不可修改的整数序列,或纯粹的 ASCII 字符,它的用途是存储二进制数据。

可以通过在一个字符串前面加上'b'来创建一个bytes literal;

也可以通过bytes() 函数创建一个 bytes 对象。

注意:如果bytes() 函数的初始化器是一个字符串,那么必须提供一种编码。

b1 =b'This is string'

b2 =bytes('This is string', 'UTF-8')  # 必须指定编码格式

字符串对象与字节对象是不兼容的,要将 bytes 转变为 str, bytes 对象必须要进行解码,使用decode() 方法:

b = bytes('This is string', 'UTF-8')

print(b, b.decode(), sep='\n')

# 输出:

# b'This is string'

# This is string

文件对象的方法(假设f是一个文件对象):

f.read(size) :读取size个字节的数据,然后作为字符串或 bytes 对象返回。size是一个可选参数,如果不指定size,则读取文件的所有内容。

f.readline() :读取一行。在字符串末尾会留下换行符 (\n),如果到文件尾,返回空字符串。

f.readlines() :读取所有行,储存在列表中,每个元素是一行,相当于list(f)。

f.write(string) :将 string 写入到文件中,返回写入的字符数。如果以二进制模式写文件,需要将string转换为 bytes 对象。

f.tell() :返回文件对象当前所处的位置,它是从文件开头开始算起的字节数。

f.seek(offset, from_what) :改变文件对象所处的位置。offset是相对参考位置的偏移量,from_what 取值 0(文件头, 默认)、1(当前位置)、2(文件尾)表示参考位置。

f.close() :关闭文件对象。

这些都是很常用的方法,当然文件对象不止这些方法。根据打开的模式不同,open() 返回的文件对象类型也不同:

TextIOWrapper:文本模式,返回TextIOWrapper对象。

BufferedReader:读二进制,即rb,返回BufferedReader对象。

BufferedWriter:写和追加二进制,即wb、ab,返回BufferedWriter对象。

BufferedRandom:读/写模式,即含有+的模式,返回BufferedRandom对象。

可以在这些文件对象上运行 dir() 或 help(),查看它们所有的方法。

 

 

操作函数目录

对文件、文件夹的操作

需要涉及到os模块和shutil模块。

(1)得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()

(2)返回指定目录下的所有文件和目录名:os.listdir()

(3)函数用来删除一个文件:os.remove()

(4)删除多个目录:os.removedirs(r"c:\python")

(5)检验给出的路径是否是一个文件:os.path.isfile()

(6)检验给出的路径是否是一个目录:os.path.isdir()

(7)判断是否是绝对路径:os.path.isabs()

(8)检验给出的路径是否真地存:os.path.exists()

(9)返回一个路径的目录名和文件名:

os.path.split()   

例如:

os.path.split('/home/swaroop/byte/code/poem.txt')

结果:

('/home/swaroop/byte/code', 'poem.txt')

(10)分离扩展名:os.path.splitext()

>>> t=os.path.splitext("d:\d.txt")

>>> t[0]

'd:\\d'

>>> t[1]

'.txt'

(11)获取路径名:os.path.dirname()

(12)获取文件名:os.path.basename()

(12)运行shell命令: os.system()

(13)读取和设置环境变量:os.getenv() 与os.putenv()

(14)给出当前平台使用的行终止符:os.linesep  

Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

指示你正在使用的平台:os.name对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'

(15)重命名:os.rename(old, new)

(16)创建多级目录:os.makedirs(r"c:\python\test")

(17)创建单个目录:os.mkdir("test")

(18)获取文件属性:os.stat(file)

(19)修改文件权限与时间戳:os.chmod(file)

(20)终止当前进程:os.exit()

(21)获取文件大小:os.path.getsize(filename)

文件操作

os.mknod("test.txt")        创建空文件

fp = open("test.txt", 'w')     直接打开一个文件,如果文件不存在则创建文件

关于open 模式:

w     以写方式打开,

a     以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+     以读写模式打开

w+     以读写模式打开 (参见 w )

a+     以读写模式打开 (参见 a )

rb     以二进制读模式打开

wb     以二进制写模式打开 (参见 w )

ab     以二进制追加模式打开 (参见 a )

rb+    以二进制读写模式打开 (参见 r+ )

wb+    以二进制读写模式打开 (参见 w+ )

ab+    以二进制读写模式打开 (参见 a+ )

fp.read([size])      #size为读取的长度,以byte为单位

fp.readline([size])    #读一行,如果定义了size,有可能返回的只是一行的一部分

fp.readlines([size])     #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。

fp.write(str)     #把str写到文件中,write()并不会在str后加上一个换行符

fp.writelines(seq)    #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。

fp.close()     #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError

fp.flush()    #把缓冲区的内容写入硬盘

fp.fileno()     #返回一个长整型的"文件标签"

fp.isatty()     #文件是否是一个终端设备文件(unix系统中的)

fp.tell()       #返回文件操作标记的当前位置,以文件的开头为原点

fp.next()      #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。

fp.seek(offset[,whence])  #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。

fp.truncate([size])   #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。

目录操作

import shutil

shutil -- High-level file operations 是一种高层次的文件操作工具

类似于高级API,而且主要强大之处在于其对文件的复制与删除操作。

(1)创建目录os.mkdir("file")

(2)复制文件:

shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是文件

shutil.copy("oldfile","newfile")            oldfile只能是文件夹,newfile可以是文件,也可以是目标目录

(3)复制文件夹:

shutil.copytree("olddir","newdir")        olddir和newdir都只能是目录,且newdir必须不存在

(4)重命名文件(目录)

os.rename("oldname","newname")       文件或目录都是使用这条命令

(5)移动文件(目录)

shutil.move("oldpos","newpos") 

(6)删除文件

os.remove("file")

(7)删除目录

os.rmdir("dir")只能删除空目录

shutil.rmtree("dir")    空目录、有内容的目录都可以删

(8)转换目录

os.chdir("path")   换路径

Example:

 (使用os.listdir)

import os
def ListFilesToTxt(dir,file,wildcard,recursion):
    exts = wildcard.split(" ")
    files = os.listdir(dir)
    for name in files:
        fullname=os.path.join(dir,name)
        if(os.path.isdir(fullname) & recursion):
            ListFilesToTxt(fullname,file,wildcard,recursion)
        else:
            for ext in exts:
                if(name.endswith(ext)):
                    file.write(name + "\n")
                    break
def Test():
    dir="/datas/Pdata"
    outfile="binaries.txt"
    wildcard = ".txt .exe .dll .lib"
    file = open(outfile,"w")
    if not file:
        print ("cannot open the file %s for writing" % outfile)
    ListFilesToTxt(dir,file,wildcard, 1)
    file.close()

 

Test()

代码:(使用os.walk) walk递归地对目录及子目录处理,每次返回的三项分别为:当前递归的目录,当前递归的目录下的所有子目录,当前递归的目录下的所有文件。

import os
def ListFilesToTxt(dir,file,wildcard,recursion):
    exts = wildcard.split(" ")
    for root, subdirs, files in os.walk(dir):
        for name in files:
            for ext in exts:
                if(name.endswith(ext)):
                    file.write(name + "\n")
                    break
        if(not recursion):
            break


def Test():
    dir="/datas/Pdata"
    outfile="binaries.txt"
    wildcard = ".txt .exe .dll .lib"
    file = open(outfile,"w")
    if not file:
        print ("cannot open the file %s for writing" % outfile)
    ListFilesToTxt(dir,file,wildcard, 0)
    file.close()

 

Test()

运行结果:

 

 

案例

将文件夹下所有图片名称加上'_fc'

python代码:

# -*- coding:utf-8 -*-
import re
import os
import time
#str.split(string)分割字符串
#'连接符'.join(list) 将列表组成字符串
def change_name(path):
    global i
    if not os.path.isdir(path) and not os.path.isfile(path):
        return False
    if os.path.isfile(path):
        file_path = os.path.split(path) #分割出目录与文件
        lists = file_path[1].split('.') #分割出文件与文件扩展名
        file_ext = lists[-1] #取出后缀名(列表切片操作)
        img_ext = ['bmp','jpeg','gif','psd','png','jpg']
        if file_ext in img_ext:
            os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
            i+=1 #注意这里的i是一个陷阱
        #或者
        #img_ext = 'bmp|jpeg|gif|psd|png|jpg'
        #if file_ext in img_ext:
        #    print('ok---'+file_ext)
    elif os.path.isdir(path):
        for x in os.listdir(path):
            change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
img_dir = 'D:\\xx\\xx\\images'
img_dir = img_dir.replace('\\','/')
start = time.time()
i = 0
change_name(img_dir)
c = time.time() - start
print('程序运行耗时:%0.2f'%(c))
print('总共处理了 %s 张图片'%(i))

输出结果:

图片改名结果:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值