Python 文件操作

最新推荐文章于 2023-11-08 23:47:34 发布

阅读量876

点赞数 1

分类专栏： Python

本文链接：https://blog.csdn.net/cckevincyh/article/details/81490588

版权

Python 专栏收录该内容

6 篇文章 2 订阅

订阅专栏

文件操作

用Python创建一个新文件

内容是从0到9的整数, 每个数字占一行：

f=open('f.txt','w')    # r只读，w可写，a追加
for i in range(0,10):f.write(str(i)+'\n')
f.close()
try:
f=open('f.txt','r')    # r只读，w可写，a追加
t=f.readlines()
print(t)
f.close()
  except Exception,e:
    f.close()

文件内容追加，从0到9的10个随机整数

import random
f=open('f.txt','a')
for i in range(0,10):f.write(str(random.randint(0,9)))
f.write('\n')
f.close()

文件内容追加，从0到9的随机整数, 10个数字一行，共10行

import random
f=open('f.txt','a')
for i in range(0,10):
     for i in range(0,10):f.write(str(random.randint(0,9)))
     f.write('\n')
f.close()

如何读取并显示

g=open('f.txt','rt')    # r只读，w可写，a追加
s=g.readlines()
print(s)
for i in range(len(s)):
    s[i]=s[i].strip('\n')
print(s)
g.close()

把标准输出定向到文件

#python

import sys

sys.stdout = open("stdout.txt", "w")

文件的读写

文件打开

f = file(name[, mode[, buffering]])

入口参数: name 文件名

mode 选项,字符串

buffering 是否缓冲 (0=不缓冲，1=缓冲, >1的int数=缓冲区大小)

返回值 : 文件对象

mode 选项:

"r" 以读方式打开，只能读文件，如果文件不存在，会发生异常

"w" 以写方式打开，只能写文件，如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

"rb" 以二进制读方式打开，只能读文件，如果文件不存在，会发生异常

"wb" 以二进制写方式打开，只能写文件，如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件。

"rt" 以文本读方式打开，只能读文件，如果文件不存在，会发生异常。

"wt" 以文本写方式打开，只能写文件，如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

"rb+" 以二进制读方式打开，可以读、写文件，如果文件不存在，会发生异常。

"wb+" 以二进制写方式打开，可以读、写文件，如果文件不存在，创建该文件。如果文件已存在，先清空，再打开文件

关闭文件

f.close()

当文件读写完毕后，应关闭文件。

清空文件内容

f.truncate()

注意：仅当以 "r+" "rb+" "w" "wb" "wb+"等以可写模式打开的文件才可以执行该功能。

文件的指针定位与查询

文件指针：

文件被打开后，其对象保存在 f 中，它会记住文件的当前位置,以便于执行读、写操作，这个位置称为文件的指针( 一个从文件头部开始计算的字节数 long 类型 )。

文件打开时的位置:

以"r" "r+" "rb+" 读方式, "w" "w+" "wb+"写方式打开的文件，一开始，文件指针均指向文件的头部。

获取文件指针的值: L = f.tell()
移动文件的指针

f.seek(偏移量, 选项)

选项 =0 时，表示将文件指针指向从文件头部到 "偏移量"字节处。

选项 =1 时，表示将文件指针指向从文件的当前位置，向后移动 "偏移量"字节。

选项 =2 时，表示将文件指针指向从文件的尾部，，向前移动 "偏移量"字节。

从文件读取指内容

1 文本文件（以"rt"方式打开的文件）的读取

          s = f.readline()

返回值：s 是字符串，从文件中读取的一行，含行结束符。

说明： (1) 如果 len( s ) =0 表示已到文件尾

(2) 如果是文件的最后一行，有可能没有行结束符

2 二进制文件（以"rb"、"rb+"、"wb+" 方式打开的文件）的读取

说明： (1) 如果 len( s ) =0 表示已到文件尾

(2) 文件读取后，文件的指针向后移动 len(s) 字节。

(3) 如果磁道已坏，会发生异常。

向文件写入一个字符串

   f.write( s )

参数： s 要写入的字符串

说明：(1)文件写入后，文件的指针向后移动 len(s) 字节。

(2)如果磁道已坏，或磁盘已满会发生异常。

返回值：s 是字符串，从文件中读取的内容

删除文件

import os

os.remove(file)

打开文件

读写文件之前，先用open()函数打开一个文件，它会返回一个文件对象(file object)：

f =open(filename，mode)

如果不指定mode参数，文件将默认以‘r'模式打开。模式中的字符有：

r：只读

w：只写，如果文件已存在则将其覆盖。如果该文件不存在，创建新文件

+：读写(不能单独使用)

a：打开文件用于追加，只写，不存在则创建新文件

b：以二进制模式打开(不能单独使用)

所以可能的模式大概有r、w、r+、w+、rb、wb、rb+、wb+、a、a+、ab、ab+，注意只有w和a可以创建文件。

通常情况下，文件都是以文本模式(text mode)打开的，也就是说，从文件中读写的是以一种特定的编码格式进行编码(默认的是 UTF-8)的字符串。如果文件以二进制模式(binary mode)打开，数据将以字节对象的形式进行读写：

f =open('a.txt','wb+')

f.write('I like apple!')  # 报错

f.write(b'I like apple!') # 以bytes对象的形式进行读写

Bytes对象是0到127的不可修改的整数序列，或纯粹的 ASCII 字符，它的用途是存储二进制数据。

可以通过在一个字符串前面加上'b'来创建一个bytes literal；

也可以通过bytes() 函数创建一个 bytes 对象。

注意：如果bytes() 函数的初始化器是一个字符串，那么必须提供一种编码。

b1 =b'This is string'

b2 =bytes('This is string', 'UTF-8')  # 必须指定编码格式

字符串对象与字节对象是不兼容的，要将 bytes 转变为 str， bytes 对象必须要进行解码，使用decode() 方法：

b = bytes('This is string', 'UTF-8')

print(b, b.decode(), sep='\n')

# 输出：

# b'This is string'

# This is string

文件对象的方法(假设f是一个文件对象)：

f.read(size) ：读取size个字节的数据，然后作为字符串或 bytes 对象返回。size是一个可选参数，如果不指定size，则读取文件的所有内容。

f.readline() ：读取一行。在字符串末尾会留下换行符 (\n)，如果到文件尾，返回空字符串。

f.readlines() ：读取所有行，储存在列表中，每个元素是一行，相当于list(f)。

f.write(string) ：将 string 写入到文件中，返回写入的字符数。如果以二进制模式写文件，需要将string转换为 bytes 对象。

f.tell() ：返回文件对象当前所处的位置，它是从文件开头开始算起的字节数。

f.seek(offset, from_what) ：改变文件对象所处的位置。offset是相对参考位置的偏移量，from_what 取值 0(文件头, 默认)、1(当前位置)、2(文件尾)表示参考位置。

f.close() ：关闭文件对象。

这些都是很常用的方法，当然文件对象不止这些方法。根据打开的模式不同，open() 返回的文件对象类型也不同：

TextIOWrapper：文本模式，返回TextIOWrapper对象。

BufferedReader：读二进制，即rb，返回BufferedReader对象。

BufferedWriter：写和追加二进制，即wb、ab，返回BufferedWriter对象。

BufferedRandom：读/写模式，即含有+的模式，返回BufferedRandom对象。

可以在这些文件对象上运行 dir() 或 help()，查看它们所有的方法。

操作函数目录

对文件、文件夹的操作

需要涉及到os模块和shutil模块。

（1）得到当前工作目录，即当前Python脚本工作的目录路径: os.getcwd()

（2）返回指定目录下的所有文件和目录名:os.listdir()

（3）函数用来删除一个文件:os.remove()

（4）删除多个目录：os.removedirs(r"c:\python")

（5）检验给出的路径是否是一个文件：os.path.isfile()

（6）检验给出的路径是否是一个目录：os.path.isdir()

（7）判断是否是绝对路径：os.path.isabs()

（8）检验给出的路径是否真地存:os.path.exists()

（9）返回一个路径的目录名和文件名:

os.path.split()

例如：

os.path.split('/home/swaroop/byte/code/poem.txt')

结果：

('/home/swaroop/byte/code', 'poem.txt')

（10）分离扩展名：os.path.splitext()

>>> t=os.path.splitext("d:\d.txt")

>>> t[0]

'd:\\d'

>>> t[1]

'.txt'

（11）获取路径名：os.path.dirname()

（12）获取文件名：os.path.basename()

（12）运行shell命令: os.system()

（13）读取和设置环境变量:os.getenv() 与os.putenv()

（14）给出当前平台使用的行终止符:os.linesep

Windows使用'\r\n'，Linux使用'\n'而Mac使用'\r'

指示你正在使用的平台：os.name对于Windows，它是'nt'，而对于Linux/Unix用户，它是'posix'

（15）重命名：os.rename(old， new)

（16）创建多级目录：os.makedirs(r"c:\python\test")

（17）创建单个目录：os.mkdir("test")

（18）获取文件属性：os.stat(file)

（19）修改文件权限与时间戳：os.chmod(file)

（20）终止当前进程：os.exit()

（21）获取文件大小：os.path.getsize(filename)

文件操作

os.mknod("test.txt") 创建空文件

fp = open("test.txt", 'w') 直接打开一个文件，如果文件不存在则创建文件

关于open 模式：

w 以写方式打开，

a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+ 以读写模式打开

w+ 以读写模式打开 (参见 w )

a+ 以读写模式打开 (参见 a )

rb 以二进制读模式打开

wb 以二进制写模式打开 (参见 w )

ab 以二进制追加模式打开 (参见 a )

rb+ 以二进制读写模式打开 (参见 r+ )

wb+ 以二进制读写模式打开 (参见 w+ )

ab+ 以二进制读写模式打开 (参见 a+ )

fp.read([size])      #size为读取的长度，以byte为单位

fp.readline([size])    #读一行，如果定义了size，有可能返回的只是一行的一部分

fp.readlines([size])     #把文件每一行作为一个list的一个成员，并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数，size是表示读取内容的总长，也就是说可能只读到文件的一部分。

fp.write(str)     #把str写到文件中，write()并不会在str后加上一个换行符

fp.writelines(seq)    #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入，不会在每行后面加上任何东西。

fp.close()     #关闭文件。python会在一个文件不用后自动关闭文件，不过这一功能没有保证，最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError

fp.flush()    #把缓冲区的内容写入硬盘

fp.fileno()     #返回一个长整型的"文件标签"

fp.isatty()     #文件是否是一个终端设备文件(unix系统中的)

fp.tell()       #返回文件操作标记的当前位置，以文件的开头为原点

fp.next()      #返回下一行，并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时，就是调用next()函数来实现遍历的。

fp.seek(offset[,whence])  #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的，一般为正数。但如果提供了whence参数就不一定了，whence可以为0表示从头开始计算，1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意，如果文件以a或a+的模式打开，每次进行写操作时，文件操作标记会自动返回到文件末尾。

fp.truncate([size])   #把文件裁成规定的大小，默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大，依据系统的不同可能是不改变文件，也可能是用0把文件补到相应的大小，也可能是以一些随机的内容加上去。

目录操作

import shutil

shutil -- High-level file operations 是一种高层次的文件操作工具

类似于高级API，而且主要强大之处在于其对文件的复制与删除操作。

（1）创建目录os.mkdir("file")

（2）复制文件：

shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是文件

shutil.copy("oldfile","newfile") oldfile只能是文件夹，newfile可以是文件，也可以是目标目录

（3）复制文件夹：

shutil.copytree("olddir","newdir") olddir和newdir都只能是目录，且newdir必须不存在

（4）重命名文件(目录)

os.rename("oldname","newname") 文件或目录都是使用这条命令

（5）移动文件(目录)

shutil.move("oldpos","newpos")

（6）删除文件

os.remove("file")

（7）删除目录

os.rmdir("dir")只能删除空目录

shutil.rmtree("dir") 空目录、有内容的目录都可以删

（8）转换目录

os.chdir("path") 换路径

Example：

(使用os.listdir)

import os
def ListFilesToTxt(dir,file,wildcard,recursion):
    exts = wildcard.split(" ")
    files = os.listdir(dir)
    for name in files:
        fullname=os.path.join(dir,name)
        if(os.path.isdir(fullname) & recursion):
            ListFilesToTxt(fullname,file,wildcard,recursion)
        else:
            for ext in exts:
                if(name.endswith(ext)):
                    file.write(name + "\n")
                    break
def Test():
    dir="/datas/Pdata"
    outfile="binaries.txt"
    wildcard = ".txt .exe .dll .lib"
    file = open(outfile,"w")
    if not file:
        print ("cannot open the file %s for writing" % outfile)
    ListFilesToTxt(dir,file,wildcard, 1)
    file.close()

Test()

代码：(使用os.walk) walk递归地对目录及子目录处理，每次返回的三项分别为：当前递归的目录，当前递归的目录下的所有子目录，当前递归的目录下的所有文件。

import os
def ListFilesToTxt(dir,file,wildcard,recursion):
    exts = wildcard.split(" ")
    for root, subdirs, files in os.walk(dir):
        for name in files:
            for ext in exts:
                if(name.endswith(ext)):
                    file.write(name + "\n")
                    break
        if(not recursion):
            break


def Test():
    dir="/datas/Pdata"
    outfile="binaries.txt"
    wildcard = ".txt .exe .dll .lib"
    file = open(outfile,"w")
    if not file:
        print ("cannot open the file %s for writing" % outfile)
    ListFilesToTxt(dir,file,wildcard, 0)
    file.close()

Test()

运行结果：

案例

将文件夹下所有图片名称加上'_fc'

python代码:

# -*- coding:utf-8 -*-
import re
import os
import time
#str.split(string)分割字符串
#'连接符'.join(list) 将列表组成字符串
def change_name(path):
    global i
    if not os.path.isdir(path) and not os.path.isfile(path):
        return False
    if os.path.isfile(path):
        file_path = os.path.split(path) #分割出目录与文件
        lists = file_path[1].split('.') #分割出文件与文件扩展名
        file_ext = lists[-1] #取出后缀名(列表切片操作)
        img_ext = ['bmp','jpeg','gif','psd','png','jpg']
        if file_ext in img_ext:
            os.rename(path,file_path[0]+'/'+lists[0]+'_fc.'+file_ext)
            i+=1 #注意这里的i是一个陷阱
        #或者
        #img_ext = 'bmp|jpeg|gif|psd|png|jpg'
        #if file_ext in img_ext:
        #    print('ok---'+file_ext)
    elif os.path.isdir(path):
        for x in os.listdir(path):
            change_name(os.path.join(path,x)) #os.path.join()在路径处理上很有用
img_dir = 'D:\\xx\\xx\\images'
img_dir = img_dir.replace('\\','/')
start = time.time()
i = 0
change_name(img_dir)
c = time.time() - start
print('程序运行耗时:%0.2f'%(c))
print('总共处理了 %s 张图片'%(i))

输出结果：