python---文件操作

30岁老阿姨

已于 2023-12-22 08:55:23 修改

阅读量110

点赞数

分类专栏： python 文章标签： python 数据库前端

于 2023-11-08 16:36:12 首次发布

本文链接：https://blog.csdn.net/yaya_jn/article/details/134245129

版权

python 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

open函数

def open (file,mode='r',buffering=None, encoding=None,errors=None,newline=None,closefd=True): # known special case of open

打开文件返回流。如果失败，抛异常：IOError

file指定要打开的文件的文本名称(如果文件不在当前工作目录，则表示文件路径)或者整数形式的文件描述符。(如果赋值文件描述符，则当该方法返回的I/O对象关闭的时候文件描述符关闭，除非closefd设置为False)

mode是一个可选的字符串，用于指定以什么模式打开文件。默认是'r'，表示以只读的文本模式打开文件。其他常用值'w'表示写(如果文件存在就清空文件内容)，'x'表示创建一个新文件并以写模式打开，'a'表示追加(对于一些Unix系统，不管当前的seek位置，仅仅是追加到文件的末尾)。在文本模式，如果没有指定encoding，则编码与平台有关：调用locale.getpreferredencoding(False)来获取当前的编码方式。(对于纯字节读写模式，不需要指定encoding) 可用的模式如下：
===============================================================
字符含义
--------- ---------------------------------------------------------------
'r' 打开只读(默认)
'w' 打开文件写，首先清空文件内容
'x' 创建一个新文件，打开文件写
'a' 打开文件写，如果文件存在，则在文件末尾追加
'b' 二进制模式
't' 文本模式(默认)
'+' 打开磁盘文件更新(读和写)
'U' 通用的newline模式(deprecated)
===============================================================

默认模式是'rt'(以文本模式打开读取)。对于二进制随机访问，'w+b'打开文件并清空文件内容为0字节，'r+b'打开文件不清空文件内容。'x'模式意味着'w'，如果文件存在，则抛异常`FileExistsError`

即使底层操作系统不区分，Python也会区分文件是以二进制模式打开还是以文本模式打开。以二进制模式(在模式参数中添加'b')打开的文件返回不加任何解码的字节对象。文本模式打开的文件返回字符串，字节首先以平台相关的编码进行解码，或者使用指定的编码进行解码。'U'模式已经过时了在以后的Python版本中会抛异常。在Python3中没有任何作用。使用newline控制通用的newline模式。

buffering是可选的，值是整数，用于设置缓存策略。0表示关闭缓存(仅在二进制模式可用)，1表示缓存一行(仅对文本模式有效)，任何>1的整数指定片段缓存的大小值(字节值)。如果不指定缓存参数，默认的缓存策略如下：

* 二进制文件以定长的片段进行缓存；缓存的大小一般是底层设备的"block size" 即`io.DEFAULT_BUFFER_SIZE`。在很多操作系统中，缓存大小典型值为4096或8192个字节。

* “交互式”文本文件(调用isatty()返回True的文件)使用行缓存。其他文本文件使用上述二进制文件的缓存策略。

encoding 用于对文件进行编码和解码的编码名称。只用于文本模式。默认编码方式是平台相关的，可以指定任何Python支持的编码名称。Python支持的编码方式可以查看codecs模块。

errors是一个可选字符串，它指定如何处理编码和解码错误-不能在二进制模式下使用。可以使用各种标准错误处理程序（在“错误处理程序”下列出），尽管已向codecs.register_error()注册的任何错误处理名称也有效。标准名称包括：

'strict'：如果存在编码错误，则抛出ValueError异常。默认值None具有相同的效果。
'ignore'：忽略错误。请注意，忽略编码错误可能会导致数据丢失。
'replace'：导致替换标记（例如“?”）插入到数据格式不正确的地方。
'surrogateescape'：将表示所有不正确的字节，作为Unicode私有使用区中从U + DC80到U + DCFF的代码点。当在写入数据时使用surrogateescape错误处理程序时，这些专用代码点将被转换回相同的字节。这对于处理未知编码的文件很有用。
'xmlcharrefreplace'：仅在写入文件时才支持"xmlcharrefreplace"。编码不支持的字符被替换为适当的XML字符引用&#nnn;。
'backslashreplace'：用Python的反斜杠转义序列替换格式错误的数据。
'namereplace'：（仅在写入时也受支持）用\N {...}转义序列替换不支持的字符。

newline 控制如何设置新行(仅对文本模式有效)。可以是None、''、'\n'、'\r'以及'\r\n'。It works as follows:

* 对于输入，如果newline是None，使用通用新行模式。输入中的行可以以'\n'、'\r'或者'\r\n'结尾，这些符号会首先转换为'\n'然后再返回给调用者。如果是''，也使用通用的新行模式，但是行结尾字符会直接返回给调用者而不做任何转换。如果指定了其他合法的值，则按照给定值截取行，行的结尾字符直接返回给调用者而不做任何转换。

* 对于输出，如果newline是None，任何'\n'字符会转换为系统默认的行分隔符，即os.linesep。如果指定为''或者'\n'，不做任何转换如果是其他合法字符，任何'\n'字符会转换为给定的字符。

如果closefd为False并且给出了文件描述符而不是文件名，则在关闭文件时，基础文件描述符将保持打开状态。如果给定文件名，closefd必须为True（默认值），否则将引发错误。

open()返回一个file对象，它的类型依赖于打开的模式，根据打开的模式对文件进行标准的读写操作。当使用文本模式打开一个文件('w'、'r'、'wt'、'rt'等)，open()方法返回一个TextIOWrapper对象。当使用二进制模式打开一个文件，返回的类有几种情况：二进制度模式open()方法返回的对象是BufferedReader，二进制写模式open()方法返回的是BufferedWriter，读/写模式，返回的是BufferedRandom。

也有可能使用字符串或字节数组作为文件来读写。字符串可以使用StringIO以文本模式的文件来操作，字节可以使用BytesIO以二进制模式的文件来操作。
"""
pass

模式和解释

模式	备注
t	文本模式 (默认)。
x	写模式，新建一个文件，如果该文件已存在则会报错。
b	二进制模式。
+	打开一个文件进行更新(可读可写)。
U	通用换行模式（Python 3 不支持）。
r	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w	打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
w+	打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb+	以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
a+	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
ab+	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

file对象方法

常用方法	备注
file.close()	关闭文件。关闭后文件不能再进行读写操作。
file.flush()	刷新文件内部缓冲，直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
file.fileno()	返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。
file.isatty()	如果文件连接到一个终端设备返回 True，否则返回 False。
file.next()	Python 3 中的 File 对象不支持 next() 方法。返回文件下一行。
file.read([size])	从文件读取指定的字节数，如果未给定或为负则读取所有。
file.readline([size])	读取整行，包括 "\n" 字符。
file.readlines([sizeint])	读取所有行并返回列表，若给定sizeint>0，返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。
file.seek(offset[, whence])	设置文件当前位置
file.tell()	返回文件当前位置。
file.truncate([size])	从文件的首行首字符开始截断，截断文件为 size 个字符，无 size 表示从当前位置截断；截断之后后面的所有字符被删除，其中 Widnows 系统下的换行代表2个字符大小。
file.write(str)	将字符串写入文件，返回的是写入的字符长度。
file.writelines(sequence)	向文件写入一个序列字符串列表，如果需要换行则要自己加入每行的换行符。

os模块

函数	备注
os.access(path, mode)	检验权限模式
os.chdir(path)	改变当前工作目录
os.chflags(path, flags)	设置路径的标记为数字标记。
os.chmod(path, mode)	更改权限
os.chown(path, uid, gid)	更改文件所有者
os.chroot(path)	改变当前进程的根目录
os.close(fd)	关闭文件描述符 fd
os.closerange(fd_low, fd_high)	关闭所有文件描述符，从 fd_low (包含) 到 fd_high (不包含), 错误会忽略
os.dup(fd)	复制文件描述符 fd
os.dup2(fd, fd2)	将一个文件描述符 fd 复制到另一个fd2
os.fchdir(fd)	通过文件描述符改变当前工作目录
os.fchmod(fd, mode)	改变一个文件的访问权限，该文件由参数fd指定，参数mode是Unix下的文件访问权限。
os.fchown(fd, uid, gid)	修改一个文件的所有权，这个函数修改一个文件的用户ID和用户组ID，该文件由文件描述符fd指定。
os.fdatasync(fd)	强制将文件写入磁盘，该文件由文件描述符fd指定，但是不强制更新文件的状态信息。
os.fdopen(fd[, mode[, bufsize]])	通过文件描述符 fd 创建一个文件对象，并返回这个文件对象
os.fpathconf(fd, name)	返回一个打开的文件的系统配置信息。name为检索的系统配置的值，它也许是一个定义系统值的字符串，这些名字在很多标准中指定（POSIX.1, Unix 95, Unix 98, 和其它）。
os.fstat(fd)	返回文件描述符fd的状态，像stat()。
os.fstatvfs(fd)	返回包含文件描述符fd的文件的文件系统的信息，Python 3.3 相等于 statvfs()。
os.fsync(fd)	强制将文件描述符为fd的文件写入硬盘。
os.ftruncate(fd, length)	裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。
os.getcwd()	返回当前工作目录
os.getcwdu()	返回一个当前工作目录的Unicode对象
os.isatty(fd)	如果文件描述符fd是打开的，同时与tty(-like)设备相连，则返回true, 否则False。
os.lchflags(path, flags)	设置路径的标记为数字标记，类似 chflags()，但是没有软链接
os.lchmod(path, mode)	修改连接文件权限
os.lchown(path, uid, gid)	更改文件所有者，类似 chown，但是不追踪链接。
os.link(src, dst)	创建硬链接，名为参数 dst，指向参数 src
os.listdir(path)	返回path指定的文件夹包含的文件或文件夹的名字的列表。
os.lseek(fd, pos, how)	设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix，Windows中有效
os.lstat(path)	像stat(),但是没有软链接
os.major(device)	从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。
os.makedev(major, minor)	以major和minor设备号组成一个原始设备号
os.makedirs(path[, mode])	递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。
os.minor(device)	从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。
os.mkdir(path[, mode])	以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。
os.mkfifo(path[, mode])	创建命名管道，mode 为数字，默认为 0666 (八进制)
os.mknod(filename[, mode=0600, device])	创建一个名为filename文件系统节点（文件，设备特别文件或者命名pipe）。
os.open(file, flags[, mode])	打开一个文件，并且设置需要的打开选项，mode参数是可选的
os.openpty()	打开一个新的伪终端对。返回 pty 和 tty的文件描述符。
os.pathconf(path, name)	返回相关文件的系统配置信息。
os.pipe()	创建一个管道. 返回一对文件描述符(r, w) 分别为读和写
os.popen(command[, mode[, bufsize]])	从一个 command 打开一个管道
os.read(fd, n)	从文件描述符 fd 中读取最多 n 个字节，返回包含读取字节的字符串，文件描述符 fd对应文件已达到结尾, 返回一个空字符串。
os.readlink(path)	返回软链接所指向的文件
os.remove(path)	删除路径为path的文件。如果path 是一个文件夹，将抛出OSError; 查看下面的rmdir()删除一个 directory。
os.removedirs(path)	递归删除目录。
os.rename(src, dst)	重命名文件或目录，从 src 到 dst
os.renames(old, new)	递归地对目录进行更名，也可以对文件进行更名。
os.rmdir(path)	删除path指定的空目录，如果目录非空，则抛出一个OSError异常。
os.stat(path)	获取path指定的路径的信息，功能等同于C API中的stat()系统调用。
os.stat_float_times([newvalue])	决定stat_result是否以float对象显示时间戳
os.statvfs(path)	获取指定路径的文件系统统计信息
os.symlink(src, dst)	创建一个软链接
os.tcgetpgrp(fd)	返回与终端fd（一个由os.open()返回的打开的文件描述符）关联的进程组
os.tcsetpgrp(fd, pg)	设置与终端fd（一个由os.open()返回的打开的文件描述符）关联的进程组为pg。
os.ttyname(fd)	返回一个字符串，它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联，则引发一个异常。
os.unlink(path)	删除文件路径
os.utime(path, times)	返回指定的path文件的访问和修改的时间。
os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])	输出在文件夹中的文件名通过在树中游走，向上或者向下。
os.write(fd, str)	写入字符串到文件描述符fd中，返回实际写入的字符串长度
os.path模块	获取文件的属性信息。
os.system(command)	在子shell中执行操作系统命令

操作

import os

读文件

file = open(r'E:\大数据数据搜集的网站.txt','r',encoding='utf-8')

for line in file.readlines():
    print(line)

file.close()

写文件

file = open(r'E:\mydata.txt', 'w', encoding='utf-8')

for i in range(10):
    file.write('1234567890\n')
file.close()

file = open(r'E:\mydata.txt', 'r', encoding='utf-8')

file.seek(5)
print(file.readline())

file.seek(100)
print(file.readline())
print(file.tell())
file.close()

file = open(r'E:\大数据数据搜集的网站.txt', 'r', encoding='utf-8')
file1 = open(r'E:\mydata.txt', 'w', encoding='utf-8')

for line in file.readlines():
    file1.write(line)
    file1.write("\n")

file.close()
file1.flush()
file1.close()

import os

mydir = r'E:\Anaconda3'

print(os.path.isdir(mydir))

if os.path.isdir(mydir):
    print("目录：", mydir)

files = os.listdir(mydir)

for myfile in files:
    if os.path.isdir(mydir + "\\" + myfile):
        print("目录：", myfile)
    else:
        print("文件：", myfile)

30岁老阿姨

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
python---文件操作

其他常用值'w'表示写(如果文件存在就清空文件内容)，'x'表示创建一个新文件并以写模式打开，'a'表示追加(对于一些Unix系统，不管当前的seek位置，仅仅是追加到文件的末尾)。当使用二进制模式打开一个文件，返回的类有几种情况：二进制度模式open()方法返回的对象是BufferedReader，二进制写模式open()方法返回的是BufferedWriter，读/写模式，返回的是BufferedRandom。返回一个打开的文件的系统配置信息。可以是None、''、'\n'、'\r'以及'\r\n'。
复制链接

扫一扫