文件
- 长久保存信息的一种数据信息集合
- 常用操作
- 打开关闭(文件一旦打开,需要关闭操作)
- 读写内容
- 查找
open函数
-
open函数负责打开文件,带有很多参数
-
第一个参数: 必须有,文件的路径和名称
-
mode:表明文件用什么方式打开
- r:以只读方式打开
- w:写方式打开,会覆盖以前的内容
- x:创建方式打开,如文件已经存在,报错
- a:append方式,以追加的方式对文件内容进行写入
- b: binary方式,二进制方式写入
- t: 文本方式打开
- +: 可读写
-
open(file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
- 注意:中文必须加上: encoding = ‘UTF-8’
# 打开文件,用写的方式
# r表示后面字符串内容不需要转义
# f称之为文件句柄
f = open(r"test01.txt", 'w')
# 文件打开后必须关闭
f.close()
# 此案例说明,以写方式打开文件,默认是如果没有文件,则创建
注意:此案例说明,以写方式打开文件,默认是如果没有文件,则创建
with语句
- with语句使用的技术是一种成为上下文管理协议的技术(ContextManagementProtocal)
- 自动判断文件的 作用域, 自动关闭不在使用的打开的文件句柄
建议用with语句 - r"test01.txt"中的r表示原义
# with语句案例
with open(r"test01.txt", 'r') as f:
pass
# 下面语句块开始对文件f进行操作
# 在本模块中不需要在使用close关闭文件f
readline函数用来一行一行的读取文件
# with案例
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
# 按行读取内容
strline = f.readline()
# 此结构保证能够完整读取文件知道结束
while strline:
print(strline)
strline = f.readline()
输出:
假若他日相逢
我将何以贺你
以沉默
以眼泪
list能用打开的文件作为参数,把文件内每一行内容作为一个元素
# list能用打开的文件作为参数,把文件内每一行内容作为一个元素
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
# 以打开的文件f作为参数,创建列表
l = list(f)
for line in l:
print(line)
输出:
假若他日相逢
我将何以贺你
以沉默
以眼泪
read是按字符读取文件内容
- read( )表示从文件头读到文件尾
- read(n)表示读n个字符,一个汉字包含3个字节
- read 可以与tell以及seek函数联合,获取任意地址的文件内容
# read是按字符读取文件内容
# 允许输入参数决定读取几个字符,
# 如果没有指定参数,从当前位置读取到结尾
# 否则,从当前位置读取指定个数字符
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
strChar = f.read(1)
print(len(strChar))
print(strChar)
# 作业:
# 使用read读取文件,每次读取一个,使用循环读完
# 尽量保持格式
输出:
1
假
作业: 使用read读取文件,每次读取一个,使用循环读完
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
i = f.read(1)
while i:
print(i)
i = f.read(1)
seek(offset, from)
- 移动文件的读取位置,也叫读取指针
- from的取值范围:
- 0: 从文件头开始偏移
- 1:从文件当前位置开始偏移
- 2: 从文件末尾开始偏移
- 移动的单位是字节(byte)
- 一个汉字由若干个字节构成
- 返回文件只针对 当前位置
# seek案例
# 打开文件后,从第5个字节出开始读取
# 打开读写指针在0处, 即文件的开头
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
# seek移动单位是字节
f.seek(6, 0)
strChar = f.read()
print(strChar)
输出:
他日相逢
我将何以贺你
以沉默
以眼泪
# 关于读取文件的练习
# 打开文件,三个字符一组读出内容,然后显示在屏幕上
# 每读一次,休息一秒钟
# 让程序暂停,可以使用time下的sleep函数
import time
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
# read参数的单位是字符,可以理解成一个汉字就是一个字符
strChar = f.read(3)
while strChar:
print(strChar)
# sleep参数单位是秒
time.sleep(1)
strChar = f.read(3)
# 作业:
# 解释以下运行结果,为什么不是每行三个字符
回答:换行符和空格符也算做一个字符
输出:
假若他
日相逢
我将
何以贺
你
以
沉默
以眼泪
UTF-8中的中文字符占用3个字节
- 查看每个字符的二进制输出
# 每个字符的二进制内容
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
strChar = f.read(3)
for i in strChar:
print(type(i))
print(len(i))
j = bytes(i,'UTF-8')
for k in j:
print(bin(k))
输出:
<class ‘str’>
1
0b11101111
0b10111011
0b10111111
<class ‘str’>
1
0b1010
<class ‘str’>
1
0b11100101
0b10000001
0b10000111
tell函数: 用来显示文件读写指针的当前位置
- 用法:pos = f.tell( )
# tell函数: 用来显示文件读写指针的当前位置
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
strChar = f.read(3)
pos = f.tell()
while strChar:
print(pos)
print(strChar)
strChar = f.read(3)
pos = f.tell()
# 以下结果说明:
# tell的返回数字的单位是byte
# read是以字符为单位
输出:
9
假若他
18
日相逢
25
我将
34
何以贺
41
你
以
48
沉默
57
以眼泪
文件的写操作-write
- write(str): 把字符串写入文件
- writeline(str): 把字符串按行写入文件
- 区别:
- write函数参数只能是字符串
- writerline参数可以是字符串,也可以是字符序列
# write 案例
# 1. 向文件追加一句诗
# a代表追加方式打开
with open(r'test01.txt', 'a', encoding = 'UTF-8') as f:
# 注意字符串内含有换行符
f.write("生活不仅有眼前的苟且, \n 还有远方的苟且")
# 可以直接写入行, 用writelines
# writelines表示写入很多行,参数可以是list格式
# a代表追加方式打开
with open(r'test01.txt', 'a') as f:
# 注意字符串内含有换行符
f.writelines("生活不仅有眼前的苟且")
f.writelines("还有远方的枸杞")
l = ["I", "love", "wangxiaojing"]
# a代表追加方式打开
with open(r'test01.txt', 'w') as f:
# 注意字符串内含有换行符
f.writelines(l)
持久化 - pickle
- 序列化(持久化,落地):把程序运行中的信息保存在磁盘上
- 反序列化: 序列号的逆过程
- pickle: python提供的序列化模块
- pickle.dump:序列化
- pickle.load:反序列化
# 序列化案例
import pickle
age = 19
with open(r'test01.txt', 'wb', encoding = 'UTF-8') as f:
pickle.dump(age, f)
# 反序列化案例
import pickle
with open(r'test01.txt', 'rb') as f:
age = pickle.load(f)
print(age)
输出:
19
# 序列化案例
import pickle
a = [19, 'liudana', "i love wangxiaojing", [185, 76]]
with open(r'test01.txt', 'wb') as f:
pickle.dump(a, f)
with open(r'test01.txt', 'rb') as f:
a = pickle.load(f)
print(a)
输出:
[19, ‘liudana’, ‘i love wangxiaojing’, [185, 76]]
持久化-shelve
- 持久化工具
- 类似字典,用kv对保存数据,存取方式跟字典也类似
- open, close
# 使用shelve创建文件并使用
import shelve
# 打开文件
# shv相当于一个字典
shv = shelve.open(r'shv.db')
shv['one'] = 1
shv['two'] = 2
shv['three'] = 3
shv.close()
# 通过以上案例发现,shelve自动创建的不仅仅是一个shv.db文件,还包括其他格式文件
- shelve打开了必须关闭
- 最好采用:**try…finally… **语句
# shelve读取案例
shv = shelve.open(r'shv.db')
try:
print(shv['one'])
print(shv['threee'])
except Exception as e:
print("烦死了")
finally:
shv.close()
输出:
1
烦死了
shelve特性
- 不支持多个应用并行写入
- 为了解决这个问题,open的时候可以使用flag=r
- 写回问题
- shelve恶魔人情况下不会等待持久化对象进行任何修改
- 解决方法: 强制写回:writeback=True
# shelve 之只读打开
import shelve
shv = shelve.open(r'shv.db', flag='r')
try:
k1 = shv['one']
print(k1)
finally:
shv.close()
输出:
1
import shelve
shv = shelve.open(r'shv.db')
try:
shv['one'] = {"eins":1, "zwei":2, "drei":3}
finally:
shv.close()
shv = shelve.open(r'shv.db')
try:
one = shv['one']
print(one)
finally:
shv.close()
输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
如果修改内容,需要使用强制写回,方法采用: writeback=True
# shelve忘记写回,需要使用强制写回
shv = shelve.open(r'shv.db')
try:
k1 = shv['one']
print(k1)
# 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
k1["eins"] =100
finally:
shv.close()
shv = shelve.open(r'shv.db')
try:
k1 = shv['one']
print(k1)
finally:
shv.close()
输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
# shelve忘记写回,需要使用强制写回
shv = shelve.open(r'shv.db', writeback=True)
try:
k1 = shv['one']
print(k1)
# 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
k1["eins"] =100
finally:
shv.close()
shv = shelve.open(r'shv.db')
try:
k1 = shv['one']
print(k1)
finally:
shv.close()
输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}
# shelve 使用with管理上下文环境
with shelve.open(r'shv.db', writeback=True) as shv:
k1 = shv['one']
print(k1)
# 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
k1["eins"] =1000
with shelve.open(r'shv.db') as shv:
print(shv['one'])
输出:
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1000, ‘zwei’: 2, ‘drei’: 3}
json特性
- JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。
- JSON的数据格式其实就是python里面的字典格式,里面可以包含方括号括起来的数组,也就是python里面的列表。
- Json 模块提供了四个方法: dumps、dump、loads、load
import json
x = [1,2,3]
y = json.dumps(x)
print(type(y))
json.loads(y)
输出:
<class ‘str’>
[1, 2, 3]
json的 dumps 和 dump:
dumps和dump 序列化方法
- dumps只完成了序列化为str,
- dump必须传文件描述符,将序列化的str保存到文件中
def dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
allow_nan=True, cls=None, indent=None, separators=None,
default=None, sort_keys=False, **kw):
# Serialize ``obj`` to a JSON formatted ``str``.
# 序列号 “obj” 数据类型 转换为 JSON格式的字符串
def dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,
allow_nan=True, cls=None, indent=None, separators=None,
default=None, sort_keys=False, **kw):
"""Serialize ``obj`` as a JSON formatted stream to ``fp`` (a
``.write()``-supporting file-like object).
我理解为两个动作,一个动作是将”obj“转换为JSON格式的字符串,还有一个动作是将字符串写入到文件中,也就是说文件描述符fp是必须要的参数 """
实例:
>>> import json
>>> json.dumps([]) # dumps可以格式化所有的基本数据类型为字符串
'[]'
>>> json.dumps(1) # 数字
'1'
>>> json.dumps('1') # 字符串
'"1"'
>>> dict = {"name":"Tom", "age":23}
>>> json.dumps(dict) # 字典
'{"name": "Tom", "age": 23}'
a = {"name":"Tom", "age":23}
with open("test.json", "w", encoding='utf-8') as f:
# indent 超级好用,格式化保存字典,默认为None,小于0为零个空格
f.write(json.dumps(a, indent=4))
# json.dump(a,f,indent=4) # 和上面的效果一样
json的loads 和 load
loads和load 反序列化方法
- loads 只完成了反序列化,
- load 只接收文件描述符,完成了读取文件和反序列化
def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
"""Deserialize ``s`` (a ``str`` instance containing a JSON document) to a Python object.
将包含str类型的JSON文档反序列化为一个python对象"""
def load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
"""Deserialize ``fp`` (a ``.read()``-supporting file-like object containing a JSON document) to a Python object.
将一个包含JSON格式数据的可读文件饭序列化为一个python对象"""
实例:
>>> json.loads('{"name":"Tom", "age":23}')
{'age': 23, 'name': 'Tom'}
import json
with open("test.json", "r", encoding='utf-8') as f:
aa = json.loads(f.read())
f.seek(0)
bb = json.load(f) # 与 json.loads(f.read())
print(aa)
print(bb)
输出:
{‘name’: ‘Tom’, ‘age’: 23}
{‘name’: ‘Tom’, ‘age’: 23}
总结
-
-
json序列化方法:
dumps:无文件操作 dump:序列化+写入文件
-
-
-
json反序列化方法:
loads:无文件操作 load: 读文件+反序列化
-
修改自图灵学院课程文件
CSV文件读写
csv(comma separeated values) 格式的文件常用于电子表格和数据库中的导入和导出。
- csv.reader(fp,delimiter= ’ ‘,quotechar=’ ')
- csv.writer(fp,delimiter=’ ‘, quotechar=’ ')
– writerrow( ) - csv.DictReader(fp)
- csv.DictWriter(fp,fieldnames=’ ')