1.Open函数使用
Python open() 方法用于打开一个文件,并返回文件对象。
在对文件进行处理过程都需要使用到这个函数,如果该文件无法被打开,会报错。
注意:使用 open() 方法一定要保证关闭文件对象,即调用 close() 方法。
open() 函数常用形式是接收两个参数:文件名(file)和模式(mode)。
open(file, mode='r')
完整的语法格式为:
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
参数说明:
-
file:
- 必需参数,表示要打开的文件路径(字符串类型)。
- 可以是文件的绝对路径或相对路径。如果文件不在当前工作目录下,建议使用绝对路径来确保准确性。
-
mode:
- 可选参数,默认为
'r'
,表示文件打开的模式。 - 其他常用的模式有
'w'
(写入模式)、'a'
(追加模式)等。完整的模式列表见下文。
- 可选参数,默认为
-
buffering:
- 可选参数,默认为
-1
,表示使用默认的缓冲策略。 - 0 表示不缓冲(直接写入磁盘),1 表示缓冲一行,大于 1 表示缓冲区大小(以字节为单位)。
- 可选参数,默认为
-
encoding:
- 可选参数,用于指定文件的编码格式,例如
'utf-8'
。 - 如果不指定,则使用默认编码(通常是操作系统默认的编码)。
- 可选参数,用于指定文件的编码格式,例如
-
errors:
- 可选参数,指定编码错误的处理方式,例如
'ignore'
表示忽略错误,'strict'
表示引发异常。 - 默认为
None
,即使用系统默认的错误处理方式。
- 可选参数,指定编码错误的处理方式,例如
-
newline:
- 控制换行符的处理。可以是
None
、''
、'\n'
、'\r'
或'\r\n'
。 - 如果是
None
,则使用系统默认的换行符处理。
- 控制换行符的处理。可以是
-
closefd:
- 对于传入的文件描述符(integer 类型的文件描述符),设置为
False
可以防止close()
方法关闭与该文件描述符相关的底层文件。 - 默认为
True
。
- 对于传入的文件描述符(integer 类型的文件描述符),设置为
-
opener:
- 可选参数,用于自定义打开文件的方法(比如在特定操作系统下使用特定的方法打开文件)。
mode 参数
模式 | 描述 |
---|---|
t | 文本模式 (默认)。 |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
+ | 打开一个文件进行更新(可读可写)。 |
U | 通用换行模式(Python 3 不支持)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
默认为文本模式,如果要以二进制模式打开,加上 b 。
file对象
序号 | 方法及描述 |
---|---|
1 | 关闭文件。关闭后文件不能再进行读写操作。 |
2 | 刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。 |
3 | 返回一个整型的文件描述符(file descriptor FD 整型), 可以用在如os模块的read方法等一些底层操作上。 |
4 | 如果文件连接到一个终端设备返回 True,否则返回 False。 |
5 | Python 3 中的 File 对象不支持 next() 方法。 返回文件下一行。 |
6 | 从文件读取指定的字节数,如果未给定或为负则读取所有。 |
7 | 读取整行,包括 "\n" 字符。 |
8 | 读取所有行并返回列表,若给定sizeint>0,返回总和大约为sizeint字节的行, 实际读取值可能比 sizeint 较大, 因为需要填充缓冲区。 |
9 | 移动文件读取指针到指定位置 |
10 | 返回文件当前位置。 |
11 | 从文件的首行首字符开始截断,截断文件为 size 个字符,无 size 表示从当前位置截断;截断之后后面的所有字符被删除,其中 windows 系统下的换行代表2个字符大小。 |
12 | 将字符串写入文件,返回的是写入的字符长度。 |
13 | 向文件写入一个序列字符串列表,如果需要换行则要自己加入每行的换行符。 |
2.Json与pickle
JSON
是一种轻量级的数据交换格式,易于人类阅读和编写,也易于机器解析和生成。在 Python 中,可以使用 json
模块来处理 JSON 数据。几乎所有编程语言都支持 JSON 格式的解析和生成,支持基本数据类型如字符串、数字、列表、字典等。
josn运用的过程可以理解为将数据类型序列化的过程。
import json
# Python 字典类型转换为 JSON 对象
data = {
'no': 1,
'name': 'CSDN',
'url': 'https://www.CSDN.com'
}
json_str = json.dumps(data)
print("Python 原始数据:", repr(data))
print("JSON 对象:", json_str)
'''
执行结果为:
Python 原始数据: {'no': 1, 'name': 'CSDN', 'url': 'https://www.CSDN.com'}
JSON 对象: {"no": 1, "name": "CSDN", "url": "https://www.CSDN.com"}
'''
而利用JSON反序列的方法则是将序列化的内容转化为Python可识别执行的数据类型 。
import json
# Python 字典类型转换为 JSON 对象
data1 = {
'no': 1,
'name': 'CSDN',
'url': 'http://www.CSDN.com'
}
json_str = json.dumps(data1)
print("Python 原始数据:", repr(data1))
print("JSON 对象:", json_str)
# 将 JSON 对象转换为 Python 字典
data2 = json.loads(json_str)
print("data2['name']: ", data2['name'])
print("data2['url']: ", data2['url'])
'''
输出结果为:
Python 原始数据: {'no': 1, 'name': 'CSDN', 'url': 'http://www.CSDN.com'}
JSON 对象: {"no": 1, "name": "CSDN", "url": "http://www.CSDN.com"}
data2['name']: CSDN
data2['url']: http://www.CSDN.com
'''
json模块的运用主要是为了保存数据,所以会存在你要转化的内容是一个文件。当识别内容为文件时,就需要我们结合open函数将内容序列化保存。
import json
with open("./data.txt", mode="r") as f:
content = f.read()
datas = json.loads(content)
print(datas)
with open("./data.txt", "r") as f:
datas = json.load(f)
print(datas)
'''
两种都会生成一个文档保存了序列化后的数据内容
'''
pickle
是 Python 特有的序列化模块,它能将 Python 对象序列化为字节流,也可以从字节流反序列化为 Python 对象。pikle的用法和json的用法一致,但是pikle不能被其他编程语言识别。
import pickle
# 当处理文件内容时
datas = {
"user": [{"id": 101, "un": "admin", "pwd": 123456}],
"student": []
}
data_bytes = pickle.dumps(datas)
with open("./data1.txt", mode="wb") as f:
data_str = f.write(data_bytes)
3.Os模块
os
模块是 Python 标准库中的一个核心模块,提供了访问操作系统功能的方法,使 Python 程序能够与操作系统进行交互。
os模块方法
序 号 | 方法及描述 |
---|---|
1 | 检验权限模式 |
2 | 改变当前工作目录 |
3 | 设置路径的标记为数字标记。 |
4 | 更改权限 |
5 | 更改文件所有者 |
6 | 改变当前进程的根目录 |
7 | 关闭文件描述符 fd |
8 | os.closerange(fd_low, fd_high) 关闭所有文件描述符,从 fd_low (包含) 到 fd_high (不包含), 错误会忽略 |
9 | 复制文件描述符 fd |
10 | 将一个文件描述符 fd 复制到另一个 fd2 |
11 | 通过文件描述符改变当前工作目录 |
12 | 改变一个文件的访问权限,该文件由参数fd指定,参数mode是Unix下的文件访问权限。 |
13 | 修改一个文件的所有权,这个函数修改一个文件的用户ID和用户组ID,该文件由文件描述符fd指定。 |
14 | 强制将文件写入磁盘,该文件由文件描述符fd指定,但是不强制更新文件的状态信息。 |
15 | os.fdopen(fd[, mode[, bufsize]]) 通过文件描述符 fd 创建一个文件对象,并返回这个文件对象 |
16 | 返回一个打开的文件的系统配置信息。name为检索的系统配置的值,它也许是一个定义系统值的字符串,这些名字在很多标准中指定(POSIX.1, Unix 95, Unix 98, 和其它)。 |
17 | 返回文件描述符fd的状态,像stat()。 |
18 | 返回包含文件描述符fd的文件的文件系统的信息,Python 3.3 相等于 statvfs()。 |
19 | 强制将文件描述符为fd的文件写入硬盘。 |
20 | 裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。 |
21 | 返回当前工作目录 |
22 | 返回一个当前工作目录的Unicode对象 |
23 | 如果文件描述符fd是打开的,同时与tty(-like)设备相连,则返回true, 否则False。 |
24 | 设置路径的标记为数字标记,类似 chflags(),但是没有软链接 |
25 | 修改连接文件权限 |
26 | 更改文件所有者,类似 chown,但是不追踪链接。 |
27 | 创建硬链接,名为参数 dst,指向参数 src |
28 | 返回path指定的文件夹包含的文件或文件夹的名字的列表。 |
29 | 设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix,Windows中有效 |
30 | 像stat(),但是没有软链接 |
31 | 从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。 |
32 | 以major和minor设备号组成一个原始设备号 |
33 | 递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。 |
34 | 从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。 |
35 | 以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。 |
36 | 创建命名管道,mode 为数字,默认为 0666 (八进制) |
37 | os.mknod(filename[, mode=0600, device]) |
38 | 打开一个文件,并且设置需要的打开选项,mode参数是可选的 |
39 | 打开一个新的伪终端对。返回 pty 和 tty的文件描述符。 |
40 | 返回相关文件的系统配置信息。 |
41 | 创建一个管道. 返回一对文件描述符(r, w) 分别为读和写 |
42 | os.popen(command[, mode[, bufsize]]) 从一个 command 打开一个管道 |
43 | 从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串,文件描述符 fd对应文件已达到结尾, 返回一个空字符串。 |
44 | 返回软链接所指向的文件 |
45 | 删除路径为path的文件。如果path 是一个文件夹,将抛出OSError; 查看下面的rmdir()删除一个 directory。 |
46 | 递归删除目录。 |
47 | 重命名文件或目录,从 src 到 dst |
48 | 递归地对目录进行更名,也可以对文件进行更名。 |
49 | 删除path指定的空目录,如果目录非空,则抛出一个OSError异常。 |
50 | 获取path指定的路径的信息,功能等同于C API中的stat()系统调用。 |
51 | os.stat_float_times([newvalue]) |
52 | 获取指定路径的文件系统统计信息 |
53 | 创建一个软链接 |
54 | 返回与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组 |
55 | 设置与终端fd(一个由os.open()返回的打开的文件描述符)关联的进程组为pg。 |
56 | os.tempnam([dir[, prefix]]) Python3 中已删除。返回唯一的路径名用于创建临时文件。 |
57 | os.tmpfile() Python3 中已删除。返回一个打开的模式为(w+b)的文件对象 .这文件对象没有文件夹入口,没有文件描述符,将会自动删除。 |
58 | os.tmpnam() Python3 中已删除。为创建一个临时文件返回一个唯一的路径 |
59 | 返回一个字符串,它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联,则引发一个异常。 |
60 | 删除文件路径 |
61 | 返回指定的path文件的访问和修改的时间。 |
62 | os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]]) 输出在文件夹中的文件名通过在树中游走,向上或者向下。 |
63 | 写入字符串到文件描述符 fd中. 返回实际写入的字符串长度 |
64 | 获取文件的属性信息。 |
65 | 获取当前目录的父目录,以字符串形式显示目录名。 |
66 | 重命名文件或目录。 |
os还可以查看CPU的核心数
import os
# cpu核心数
print(os.cpu_count())
'''
执行结果就可以看到CPU核心数
'''
os.path
os.path.exists:路径或者文件是否存在
os.path.isfile:是否为文件
os.path.isdir:是否为路径
os.path.splt:分割最后一部分和前面路径
os.path.join:将多个部分组合成一个路径
os.path.abspath:绝对路径 abspath(os.curdir)
os.path.dirname:路径名 当前路径的父路径
import os
# 是否为文件
print(os.path.isfile("e:\\ROCO专区\\悟空神辅II 2.4.0.9.exe"))
# 是否为路径
print(os.path.isdir("e:\\ROCO专区"))