python---文件操作

open函数

def open (file,mode='r',buffering=None, encoding=None,errors=None,newline=None,closefd=True): # known special case of open

    打开文件返回流。如果失败,抛异常:IOError
    
    file指定要打开的文件的文本名称(如果文件不在当前工作目录,则表示文件路径)或者整数形式的文件描述符。(如果赋值文件描述符,则当该方法返回的I/O对象关闭的时候文件描述符关闭,除非closefd设置为False)
    
    mode是一个可选的字符串,用于指定以什么模式打开文件。默认是'r',表示以只读的文本模式打开文件。其他常用值'w'表示写(如果文件存在就清空文件内容),'x'表示创建一个新文件并以写模式打开,'a'表示追加(对于一些Unix系统,不管当前的seek位置,仅仅是追加到文件的末尾)。在文本模式,如果没有指定encoding,则编码与平台有关:调用locale.getpreferredencoding(False)来获取当前的编码方式。(对于纯字节读写模式,不需要指定encoding) 可用的模式如下:
    ===============================================================
    字符含义
    --------- ---------------------------------------------------------------
    'r'       打开只读(默认)
    'w'       打开文件写,首先清空文件内容
    'x'       创建一个新文件,打开文件写
    'a'       打开文件写,如果文件存在,则在文件末尾追加
    'b'       二进制模式
    't'       文本模式(默认)
    '+'       打开磁盘文件更新(读和写)
    'U'       通用的newline模式(deprecated)
    ===============================================================
    
    默认模式是'rt'(以文本模式打开读取)。对于二进制随机访问,'w+b'打开文件并清空文件内容为0字节,'r+b'打开文件不清空文件内容。'x'模式意味着'w',如果文件存在,则抛异常`FileExistsError`
    
    即使底层操作系统不区分,Python也会区分文件是以二进制模式打开还是以文本模式打开。以二进制模式(在模式参数中添加'b')打开的文件返回不加任何解码的字节对象。文本模式打开的文件返回字符串,字节首先以平台相关的编码进行解码,或者使用指定的编码进行解码。'U'模式已经过时了在以后的Python版本中会抛异常。在Python3中没有任何作用。使用newline控制通用的newline模式。
    
    buffering是可选的,值是整数,用于设置缓存策略。0表示关闭缓存(仅在二进制模式可用),1表示缓存一行(仅对文本模式有效),任何>1的整数指定片段缓存的大小值(字节值)。如果不指定缓存参数,默认的缓存策略如下:
    
    * 二进制文件以定长的片段进行缓存;缓存的大小一般是底层设备的"block size" 即`io.DEFAULT_BUFFER_SIZE`。在很多操作系统中,缓存大小典型值为4096或8192个字节。
    
    * “交互式”文本文件(调用isatty()返回True的文件)使用行缓存。其他文本文件使用上述二进制文件的缓存策略。
    
    encoding 用于对文件进行编码和解码的编码名称。只用于文本模式。默认编码方式是平台相关的,可以指定任何Python支持的编码名称。Python支持的编码方式可以查看codecs模块。
    
    errors是一个可选字符串,它指定如何处理编码和解码错误-不能在二进制模式下使用。可以使用各种标准错误处理程序(在“错误处理程序”下列出),尽管已向codecs.register_error()注册的任何错误处理名称也有效。标准名称包括:

'strict':如果存在编码错误,则抛出ValueError异常。默认值None具有相同的效果。
'ignore':忽略错误。请注意,忽略编码错误可能会导致数据丢失。
'replace':导致替换标记(例如“?”)插入到数据格式不正确的地方。
'surrogateescape':将表示所有不正确的字节,作为Unicode私有使用区中从U + DC80到U + DCFF的代码点。当在写入数据时使用surrogateescape错误处理程序时,这些专用代码点将被转换回相同的字节。这对于处理未知编码的文件很有用。
'xmlcharrefreplace':仅在写入文件时才支持"xmlcharrefreplace"。编码不支持的字符被替换为适当的XML字符引用&#nnn;。
'backslashreplace':用Python的反斜杠转义序列替换格式错误的数据。
'namereplace':(仅在写入时也受支持)用\N {...}转义序列替换不支持的字符。
    
    newline 控制如何设置新行(仅对文本模式有效)。可以是None、''、'\n'、'\r'以及'\r\n'。It works as follows:
    
    * 对于输入,如果newline是None,使用通用新行模式。输入中的行可以以'\n'、'\r'或者'\r\n'结尾,这些符号会首先转换为'\n'然后再返回给调用者。如果是'',也使用通用的新行模式,但是行结尾字符会直接返回给调用者而不做任何转换。如果指定了其他合法的值,则按照给定值截取行,行的结尾字符直接返回给调用者而不做任何转换。
    
    * 对于输出,如果newline是None,任何'\n'字符会转换为系统默认的行分隔符,即os.linesep。如果指定为''或者'\n',不做任何转换如果是其他合法字符,任何'\n'字符会转换为给定的字符。
    
    如果closefd为False并且给出了文件描述符而不是文件名,则在关闭文件时,基础文件描述符将保持打开状态。 如果给定文件名,closefd必须为True(默认值),否则将引发错误。
    
    open()返回一个file对象,它的类型依赖于打开的模式,根据打开的模式对文件进行标准的读写操作。当使用文本模式打开一个文件('w'、'r'、'wt'、'rt'等),open()方法返回一个TextIOWrapper对象。当使用二进制模式打开一个文件,返回的类有几种情况:二进制度模式open()方法返回的对象是BufferedReader,二进制写模式open()方法返回的是BufferedWriter,读/写模式,返回的是BufferedRandom。
    
    也有可能使用字符串或字节数组作为文件来读写。字符串可以使用StringIO以文本模式的文件来操作,字节可以使用BytesIO以二进制模式的文件来操作。
    """
    pass

模式和解释

模式

备注

t

文本模式 (默认)。

x

写模式,新建一个文件,如果该文件已存在则会报错。

b

二进制模式。

+

打开一个文件进行更新(可读可写)。

U

通用换行模式(Python 3 不支持)。

r

以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb

以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。

r+

打开一个文件用于读写。文件指针将会放在文件的开头。

rb+

以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。

w

打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb

以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。

w+

打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。

wb+

以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。

a

打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

ab

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

a+

打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

ab+

以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

file对象方法

常用方法

备注

file.close()

关闭文件。关闭后文件不能再进行读写操作。

file.flush()

刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。

file.fileno()

返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。

file.isatty()

如果文件连接到一个终端设备返回 True,否则返回 False。

file.next()

Python 3 中的 File 对象不支持 next() 方法。

返回文件下一行。

file.read([size])

从文件读取指定的字节数,如果未给定或为负则读取所有。

file.readline([size])

读取整行,包括 "\n" 字符。

file.readlines([sizeint])

读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。

file.seek(offset[, whence])

设置文件当前位置

file.tell()

返回文件当前位置。

file.truncate([size])

从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 Widnows 系统下的换行代表2个字符大小。

file.write(str)

将字符串写入文件,返回的是写入的字符长度。

file.writelines(sequence)

向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。

os模块

函数

备注

os.access(path, mode)

检验权限模式

os.chdir(path)

改变当前工作目录

os.chflags(path, flags)

设置路径的标记为数字标记。

os.chmod(path, mode)

更改权限

os.chown(path, uid, gid)

更改文件所有者

os.chroot(path)

改变当前进程的根目录

os.close(fd)

关闭文件描述符 fd

os.closerange(fd_low, fd_high)

关闭所有文件描述符,从 fd_low (包含) 到 fd_high (不包含), 错误会忽略

os.dup(fd)

复制文件描述符 fd

os.dup2(fd, fd2)

将一个文件描述符 fd 复制到另一个fd2

os.fchdir(fd)

通过文件描述符改变当前工作目录

os.fchmod(fd, mode)

改变一个文件的访问权限,该文件由参数fd指定,参数mode是Unix下的文件访问权限。

os.fchown(fd, uid, gid)

修改一个文件的所有权,这个函数修改一个文件的用户ID和用户组ID,该文件由文件描述符fd指定。

os.fdatasync(fd)

强制将文件写入磁盘,该文件由文件描述符fd指定,但是不强制更新文件的状态信息。

os.fdopen(fd[, mode[, bufsize]])

通过文件描述符 fd 创建一个文件对象,并返回这个文件对象

os.fpathconf(fd, name)

返回一个打开的文件的系统配置信息。name为检索的系统配置的值,它也许是一个定义系统值的字符串,这些名字在很多标准中指定(POSIX.1, Unix 95, Unix 98, 和其它)。

os.fstat(fd)

返回文件描述符fd的状态,像stat()。

os.fstatvfs(fd)

返回包含文件描述符fd的文件的文件系统的信息,Python 3.3 相等于 statvfs()。

os.fsync(fd)

强制将文件描述符为fd的文件写入硬盘。

os.ftruncate(fd, length)

裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。

os.getcwd()

返回当前工作目录

os.getcwdu()

返回一个当前工作目录的Unicode对象

os.isatty(fd)

如果文件描述符fd是打开的,同时与tty(-like)设备相连,则返回true, 否则False。

os.lchflags(path, flags)

设置路径的标记为数字标记,类似 chflags(),但是没有软链接

os.lchmod(path, mode)

修改连接文件权限

os.lchown(path, uid, gid)

更改文件所有者,类似 chown,但是不追踪链接。

os.link(src, dst)

创建硬链接,名为参数 dst,指向参数 src

os.listdir(path)

返回path指定的文件夹包含的文件或文件夹的名字的列表

os.lseek(fd, pos, how)

设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix,Windows中有效

os.lstat(path)

像stat(),但是没有软链接

os.major(device)

从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。

os.makedev(major, minor)

以major和minor设备号组成一个原始设备号

os.makedirs(path[, mode])

递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。

os.minor(device)

从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。

os.mkdir(path[, mode])

以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。

os.mkfifo(path[, mode])

创建命名管道,mode 为数字,默认为 0666 (八进制)

os.mknod(filename[, mode=0600, device])

创建一个名为filename文件系统节点(文件,设备特别文件或者命名pipe)。

os.open(file, flags[, mode])

打开一个文件,并且设置需要的打开选项,mode参数是可选的

os.openpty()

打开一个新的伪终端对。返回 pty 和 tty的文件描述符。

os.pathconf(path, name)

返回相关文件的系统配置信息。

os.pipe()

创建一个管道. 返回一对文件描述符(r, w) 分别为读和写

os.popen(command[, mode[, bufsize]])

从一个 command 打开一个管道

os.read(fd, n)

从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串,文件描述符 fd对应文件已达到结尾, 返回一个空字符串。

os.readlink(path)

返回软链接所指向的文件

os.remove(path)

删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。

os.removedirs(path)

递归删除目录。

os.rename(src, dst)

重命名文件或目录,从 src 到 dst

os.renames(old, new)

递归地对目录进行更名,也可以对文件进行更名。

os.rmdir(path)

删除path指定的空目录,如果目录非空,则抛出一个OSError异常。

os.stat(path)

获取path指定的路径的信息,功能等同于C API中的stat()系统调用。

os.stat_float_times([newvalue])

决定stat_result是否以float对象显示时间戳

os.statvfs(path)

获取指定路径的文件系统统计信息

os.symlink(src, dst)

创建一个软链接

os.tcgetpgrp(fd)

返回与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组

os.tcsetpgrp(fd, pg)

设置与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组为pg。

os.ttyname(fd)

返回一个字符串,它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联,则引发一个异常。

os.unlink(path)

删除文件路径

os.utime(path, times)

返回指定的path文件的访问和修改的时间。

os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])

输出在文件夹中的文件名通过在树中游走,向上或者向下。

os.write(fd, str)

写入字符串到文件描述符fd中,返回实际写入的字符串长度

os.path模块

获取文件的属性信息。

os.system(command)

在子shell中执行操作系统命令

操作

import os

读文件

file = open(r'E:\大数据数据搜集的网站.txt','r',encoding='utf-8')

for line in file.readlines():
    print(line)

file.close()

写文件

file = open(r'E:\mydata.txt', 'w', encoding='utf-8')

for i in range(10):
    file.write('1234567890\n')
file.close()

file = open(r'E:\mydata.txt', 'r', encoding='utf-8')

file.seek(5)
print(file.readline())

file.seek(100)
print(file.readline())
print(file.tell())
file.close()

file = open(r'E:\大数据数据搜集的网站.txt', 'r', encoding='utf-8')
file1 = open(r'E:\mydata.txt', 'w', encoding='utf-8')

for line in file.readlines():
    file1.write(line)
    file1.write("\n")

file.close()
file1.flush()
file1.close()

import os

mydir = r'E:\Anaconda3'

print(os.path.isdir(mydir))

if os.path.isdir(mydir):
    print("目录:", mydir)

files = os.listdir(mydir)

for myfile in files:
    if os.path.isdir(mydir + "\\" + myfile):
        print("目录:", myfile)
    else:
        print("文件:", myfile)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

30岁老阿姨

支持一下哦!!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值