Python之第十章 IO及对象列化

模式	操作	作用
r	只读	默认模式，文件若不存在则会报错
w	写入	若文件不存在则会新建，若已存在会清空原有内容后输入
a	追加	若文件不存在则会新建，若已存在则在最后位置追加新内容
x	新建	若文件已存在会报错，比w安全
b	二进制	如：rb ，wb，ab 以byte类型操作
+	读写	如：r+ w+ a+

f = open('t1.txt', 'w')  # 打开

f.write('python 是一种非常好的语言，\n我喜欢Python\n')  # 写入

f.close()  # 关闭

4.b模式

二进制模式 --- 一般用于读取图片、视频等二进制文件

注意：

b模式是以byte类型读取文件的，返回的是byte对象不是字符串，必须定义编码格式，输入的类型必须保证byte类型

s = 'this is a test'
b = bytes(s, encoding='utf-8')
f = open('test.txt', 'wb')
f.write(s)
f.close()
# 打开方式为wb，写入为s串会报错

#正确写法
s = 'this is a test'
b = bytes(s, encoding='utf-8')
f = open('test.txt', 'wb')
f.write(b)
f.close()

5.+模式

对于w+模式，在读写之前会清空原有数据，建议不要使用

对于a+模式，永远只会在文件的尾部写入，有局限性，不建议使用

对于r+模式，也就是读写结合模式，配合seek( )和tell( )方法实现更多的操作

6.文件对象的操作

read（size）--- 读取一定大小的数据，然后作为字符串或字节对象返回，size为可选参数，用于指定读取的数据量，size忽略或者为负数时表示改文件所有内容都将被读取并返回

f = open('test.txt', 'r')
str1 = f.read()
print(str1)
str2 = f.read(4)
print(str2)
f.close()

# 若文件体积较大，可以分多个读取，使用read（512）方法一点一点读取

readline（）--- 从文件中读取一行或多行内容，换行为\n，若读取到最后一行则返回空串，用于读一行，处理一行，不能回头

f = open('t1.txt', 'r')

str1 = f.readline()
print(str1)
f.close()

readlines（）--- 将文件所有行，一行一行全部读入到一个列表中，按顺序存储到列表中，返回一个列表

f = open('t1.txt', 'r')

str1 = f.readlines()
print(str1)
f.close()

7.遍历文件

实际上可以将文件对象作为一个迭代器使用

f = open('t1.txt', 'r')

for i in f:
    print(i, end=' ')
    
结果：
python 是一种非常好的语言，
 我喜欢Python

8.小结

几种不同的读取文件方法，若文件容量小使用read（）一次性读取完比较方便，若不能确定文件大小则可以使用read（size）反复测试，若是配置文件可以使用readlines（）较为方便或者for循环变量

9.写方法 --- write（）

作用 --- 将字符串或者字节数据写入文件

write（）多次操作实际是在内存中完成，并不会立即写入磁盘，只有close（）后操作同步到磁盘

格式 --- 文件对象.write（‘内容’）

10.tell（）方法

用途 --- 返回文件读写指针的位置，从文件开头算起的字节数

11.seek（）方法

用途 --- 移动若干个字符到指定位置，如：seek（ x，1 ）表示从当前位置开始向后移动x个字符，seek（-x，2）从结尾开始向前移动

f = open('t1.txt', 'rb+')
f.write(b'123456789')
f.tell()
print(f.seek(5))
print(f.seek(1))
print(f.seek(2, 2))
print(f.seek(3, 1))
f.close()
# （x，数字），数字有0,1,2  0---从文件开头算起 1--- 从文件读写指针的位置开始算起 2--- 从文件结尾算起 默认为0

12.close（）

作用 --- 关闭文件对象，处理完一个文件后，关闭文件并释放资源，则关闭后若再次尝试读写操作会抛出异常，若忘记调用close（）则后果可能数据只会写入一部分，剩余数据会丢失。

3.对象序列化

1.什么是对象序列化

对容器等对象这种抽象的概念转化为真正存储的字符或字节数据的过程。

2.产生原因

便于存储 --- 序列化的过程本质就是将文本信息转为二进制数据量，Python中程序运行的数据如：序列、字符串、元组等要向永久保存方便以后使用，必须进行序列化。

便于传输 --- 当两个进程进行远距离通信时，彼此可以发送各种类型数据，无论何种类型数据都会以二进制序列进行传输，接收方收到后进行反序列化转为可以识别的字符集恢复为对象

3.pickle模块 --- 常用列表

作用 --- 通过pickle模块的序列化操作可以将运行的对象信息存储到文件中，永久保存，通过pickle反序列化操作可以从文件中回复对象

常用方法 --- dump，dumps，load，loads

# dumps 序列化为字节数据
import pickle

list1 = [10, 20, 30, 40, 50]
data1 = pickle.dumps(list1)
print(data1)

f = open('test2.txt', 'wb')
f.write(data1)
f.close()

f = open('test2.txt', 'rb')
data2 = f.read()
print(data2)
f.close()

结果：
b'\x80\x04\x95\x0f\x00\x00\x00\x00\x00\x00\x00]\x94(K\nK\x14K\x1eK(K2e.'
b'\x80\x04\x95\x0f\x00\x00\x00\x00\x00\x00\x00]\x94(K\nK\x14K\x1eK(K2e.'


import  pickle


f = open('test2.txt','rb')
show = f.read()
show = pickle.loads(show)
print(show)
f.close()

结果：
[10, 20, 30, 40, 50]

例将字符串序列化存储出道test3.txt中，读取后反序列化输出

# 例 将字符串序列化存储出道test3.txt中，读取后反序列化输出
import pickle

# dump
str1 = ['china', 'hello', 'fangfang']
data2 = pickle.dumps(str1)
print(data2)

f = open('test3.txt', 'wb')
f.write(data2)
f.close()

f = open('test3.txt', 'rb')
data2 = f.read()
f.close()
print(data2)

# load
f = open('test3.txt', 'rb')
show = f.read()
show = pickle.loads(show)
f.close()
print(show)

结果：
b'\x80\x04\x95 \x00\x00\x00\x00\x00\x00\x00]\x94(\x8c\x05china\x94\x8c\x05hello\x94\x8c\x08fangfang\x94e.'
['china', 'hello', 'fangfang']

4.json模块 --- 常用字典

作用 --- json模块将对象序列化为字符数据

方法 --- dump，dumps，load，loads

注意：

一般用于处理字典类型数据

例

import json

dict1 = {'username': 'Fang Yanhong', 'age': '18', 'number': '1'}
data2 = json.dumps(dict1)
print(json.dumps(dict1))

f = open('test4.txt', 'wt')
f.write(data2)
f.close()