python文件处理

最新推荐文章于 2022-10-21 14:00:23 发布

怕不是个弱智

最新推荐文章于 2022-10-21 14:00:23 发布

阅读量103

点赞数

分类专栏： python学习日记文章标签： python

本文链接：https://blog.csdn.net/qq_40127785/article/details/115531725

版权

python学习日记专栏收录该内容

21 篇文章 1 订阅

订阅专栏

python中的文件处理

文件的打开与关闭

打开文件

python中提供open()函数对已存在的文件进行打开，未存在的文件进行创建。

file = open('文件名.后缀名'，'访问模式')

文件路径：
- 绝对路径：文件在所在位置的绝对位置，完整描述了文件的所在地，目录层级明显，C:/Users/chris/AppData/Local/Programs/Python/Python3_7/python.exe。
- 相对路径：从当前文件所在文件夹开始的路径，是相对的，../test.txt，从当前文件夹得上一级文件夹中查找test.txt文件
访问模式：

访问模式	说明
r	以只读方式打开文件。文件的指针将会放在文件的开头。如果文件不存在，则报错。这是默认模式。
w	打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
w+	打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
a+	打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
wb+	以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
ab+	以二进制格式打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

关闭文件

文件有打开就有关闭，python提供close()函数完成对文件的关闭操作。

# 新建一个文件，文件名为:test.txt
f = open('test.txt', 'w')

# 关闭这个文件
f.close()

文件内容的读写

写数据

使用write()可完成向文件中写入数据。

f = open('test.txt', 'w')
f.write('hello world, i am here!\n' * 5)
f.close()

读数据

read()

read(num)可以从文件中读取num长度的数据(单位为字节)，如果未传入num值，将读取文件中的所有数据。
readline()

readline()用来读取一行数据。
readlines()

readlines()可以按照行的方式把整个文件中的内容进行一次性读取，并返回的是一个列表，其中每一行为列表的一个元素。

CSV文件

CSV文件：Comma-Separated Values，中文叫逗号分隔值或者字符分割值，其文件**以纯文本的形式存储表格数据。**可以把它理解为一个表格，只不过这个表格是以纯文本的形式显示的，单元格与单元格之间，默认使用逗号进行分隔；每行数据之间，使用换行进行分隔。

序列化和反序列化

通过文件操作，我们可以将字符串写入到一个本地文件。但是，如果是一个对象(例如列表、字典、元组等)，就无法直接写入到一个文件里，需要对这个对象进行序列化，然后才能写入到文件里。

设计一套协议，按照某种规则，把内存中的数据转换为字节序列，保存到文件，这就是序列化，反之，从文件的字节序列恢复到内存中，就是反序列化。

Python中提供了JSON和pickle两个模块用来实现数据的序列化和反序列化。

JSON模块

JSON(JavaScriptObjectNotation, JS对象简谱)是一种轻量级的数据交换格式，它基于 ECMAScript 的一个子集，采用完全独立于编程语言的文本格式来存储和表示数据。JSON的本质是字符串！

使用JSON实现序列化

JSON提供了dump和dumps方法，将一个对象进行序列化。

dumps方法的作用是把对象转换成为字符串，它本身不具备将数据写入到文件的功能。

import json
file = open('names.txt', 'w')
names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris']
# file.write(names)  出错，不能直接将列表写入到文件里

# 可以调用 json的dumps方法，传入一个对象参数
result = json.dumps(names)

# dumps 方法得到的结果是一个字符串
print(type(result))  # <class 'str'>

# 可以将字符串写入到文件里
file.write(result)

file.close()
Copy

dump方法可以在将对象转换成为字符串的同时，指定一个文件对象，把转换后的字符串写入到这个文件里。

import json

file = open('names.txt', 'w')
names = ['zhangsan', 'lisi', 'wangwu', 'jerry', 'henry', 'merry', 'chris']

# dump方法可以接收一个文件参数，在将对象转换成为字符串的同时写入到文件里
json.dump(names, file)
file.close()
Copy

注意：如果是一个空对象，调用dumps方法转换成为一个JSON对象，得到的结果是null(JS里的空对象)

json.dumps(None)  # null
Copy

使用JSON实现反序列化

使用loads和load方法，可以将一个JSON字符串反序列化成为一个Python对象。

loads方法需要一个字符串参数，用来将一个字符串加载成为Python对象。

import json

# 调用loads方法，传入一个字符串，可以将这个字符串加载成为Python对象
result = json.loads('["zhangsan", "lisi", "wangwu", "jerry", "henry", "merry", "chris"]')
print(type(result))  # <class 'list'>
Copy

load方法可以传入一个文件对象，用来将一个文件对象里的数据加载成为Python对象。

import json

# 以可读方式打开一个文件
file = open('names.txt', 'r')

# 调用load方法，将文件里的内容加载成为一个Python对象
result = json.load(file)

print(result)
file.close()
Copy

pickle模块

和json模块类似，pickle模块也有dump和dumps方法可以对数据进行序列化，同时也有load和loads方法进行反序列化。区别在于，json模块是将对象转换成为字符串，而pickle模块是将对象转换成为二进制。

pickle模块里方法的使用和json里方法的使用大致相同，需要注意的是，pickle是将对象转换成为二进制，所以，如果想要把内容写入到文件里，这个文件必须要以二进制的形式打开。

区别(了解)

思考: json和pickle两个模块都可以将对象进行序列化和反序列化，那它们有哪些区别，在使用场景上又该如何选择？

json模块:
- 将对象转换成为字符串，不管是在哪种操作系统，哪种编程语言里，字符串都是可识别的。
- json就是用来在不同平台间传递数据的。
- 并不是所有的对象都可以直接转换成为一个字符串，下标列出了Python对象与json字符串的对应关系。

Python	JSON
dict	object
list,tuple	array
str	string
int,float	number
True	true
False	false
None	null

如果是一个自定义对象，默认无法装换成为json字符串，需要手动指定JSONEncoder.

如果是将一个json串重新转换成为对象，这个对象里的方法就无法使用了。

import json
class MyEncode(json.JSONEncoder):
    def default(self, o):
        # return {"name":o.name,"age":o.age}
        return o.__dict__

class Person(object):
    def __init__(self, name, age):
        self.name = name
        self.age = age

      def eat(self):
          print(self.name+'正在吃东西')

p1 = Person('zhangsan', 18)

# 自定义对象想要转换成为json字符串，需要给这个自定义对象指定JSONEncoder
result = json.dumps(p1, cls=MyEncode)
print(result)  # {"name": "zhangsan", "age": 18}

# 调用loads方法将对象加载成为一个对象以后，得到的结果是一个字典
p = json.loads(result)
print(type(p))
Copy

pickle模块：
- pickle序列化是将对象按照一定的规则转换成为二进制保存，它不能跨平台传递数据。
- pickle的序列化会将对象的所有数据都保存。

怕不是个弱智

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python文件处理

python中的文件处理文件的打开与关闭打开文件python中提供open()函数对已存在的文件进行打开，未存在的文件进行创建。file = open('文件名.后缀名'，'访问模式')文件路径：绝对路径：文件在所在位置的绝对位置，完整描述了文件的所在地，目录层级明显，C:/Users/chris/AppData/Local/Programs/Python/Python3_7/python.exe。相对路径：从当前文件所在文件夹开始的路径，是相对的，../test.txt，从当前
复制链接

扫一扫

专栏目录