PYTHON 之文件操作

最新推荐文章于 2023-05-22 19:38:55 发布

戈扬

最新推荐文章于 2023-05-22 19:38:55 发布

阅读量300

点赞数

分类专栏： PYTHON

PYTHON 专栏收录该内容

67 篇文章 20 订阅

订阅专栏

文件

长久保存信息的一种数据信息集合
常用操作
- 打开关闭（文件一旦打开，需要关闭操作）
- 读写内容
- 查找

open函数

open函数负责打开文件，带有很多参数
第一个参数：必须有，文件的路径和名称
mode：表明文件用什么方式打开
- r:以只读方式打开
- w：写方式打开，会覆盖以前的内容
- x：创建方式打开，如文件已经存在，报错
- a：append方式，以追加的方式对文件内容进行写入
- b： binary方式，二进制方式写入
- t：文本方式打开
- +：可读写
open(file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
- 注意：中文必须加上: encoding = ‘UTF-8’

# 打开文件，用写的方式
# r表示后面字符串内容不需要转义
# f称之为文件句柄
f = open(r"test01.txt", 'w')
# 文件打开后必须关闭
f.close()

# 此案例说明，以写方式打开文件，默认是如果没有文件，则创建

注意：此案例说明，以写方式打开文件，默认是如果没有文件，则创建

with语句

with语句使用的技术是一种成为上下文管理协议的技术(ContextManagementProtocal)
自动判断文件的作用域，自动关闭不在使用的打开的文件句柄
建议用with语句
r"test01.txt"中的r表示原义

# with语句案例

with open(r"test01.txt", 'r') as f:
    pass
    # 下面语句块开始对文件f进行操作
    # 在本模块中不需要在使用close关闭文件f

readline函数用来一行一行的读取文件

# with案例

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # 按行读取内容
    strline = f.readline()
    # 此结构保证能够完整读取文件知道结束
    while strline:
        print(strline)
        strline = f.readline()

输出：

假若他日相逢

我将何以贺你

以沉默

以眼泪

list能用打开的文件作为参数，把文件内每一行内容作为一个元素

# list能用打开的文件作为参数，把文件内每一行内容作为一个元素

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # 以打开的文件f作为参数，创建列表
    l = list(f)
    for line in l:
        print(line)

输出：

假若他日相逢

我将何以贺你

以沉默

以眼泪

read是按字符读取文件内容

read( )表示从文件头读到文件尾
read(n)表示读n个字符，一个汉字包含3个字节
read 可以与tell以及seek函数联合，获取任意地址的文件内容

# read是按字符读取文件内容
# 允许输入参数决定读取几个字符，
# 如果没有指定参数，从当前位置读取到结尾
# 否则，从当前位置读取指定个数字符

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(1)
    print(len(strChar))
    print(strChar)
    
# 作业：
# 使用read读取文件，每次读取一个，使用循环读完
# 尽量保持格式

输出：
1
假

作业: 使用read读取文件，每次读取一个，使用循环读完

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    i = f.read(1)
    while i:
      print(i)
      i = f.read(1)

seek（offset， from)

移动文件的读取位置，也叫读取指针
from的取值范围：
- 0：从文件头开始偏移
- 1：从文件当前位置开始偏移
- 2：从文件末尾开始偏移
移动的单位是字节(byte)
一个汉字由若干个字节构成
返回文件只针对当前位置

# seek案例
# 打开文件后，从第5个字节出开始读取

# 打开读写指针在0处， 即文件的开头
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # seek移动单位是字节
    f.seek(6, 0)
    strChar = f.read()
    print(strChar)

输出：
他日相逢
我将何以贺你
以沉默
以眼泪

# 关于读取文件的练习
# 打开文件，三个字符一组读出内容，然后显示在屏幕上
# 每读一次，休息一秒钟

# 让程序暂停，可以使用time下的sleep函数
import time

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # read参数的单位是字符，可以理解成一个汉字就是一个字符
    strChar = f.read(3)
    while strChar:
        print(strChar)
        # sleep参数单位是秒
        time.sleep(1)
        strChar = f.read(3)
# 作业：
# 解释以下运行结果，为什么不是每行三个字符

回答：换行符和空格符也算做一个字符
输出：
假若他
日相逢

我将
何以贺
你
以
沉默

以眼泪

UTF-8中的中文字符占用3个字节

查看每个字符的二进制输出

# 每个字符的二进制内容
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(3)
    for i in strChar:
        print(type(i))
        print(len(i))
        j = bytes(i,'UTF-8')
        for k in j:
           print(bin(k))

输出:
<class ‘str’>
1
0b11101111
0b10111011
0b10111111
<class ‘str’>
1
0b1010
<class ‘str’>
1
0b11100101
0b10000001
0b10000111

tell函数：用来显示文件读写指针的当前位置

用法：pos = f.tell( )

# tell函数： 用来显示文件读写指针的当前位置
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(3)
    pos = f.tell()
    
    while strChar:
        print(pos)
        print(strChar)
        
        strChar = f.read(3)
        pos = f.tell()
        
# 以下结果说明：
# tell的返回数字的单位是byte
# read是以字符为单位

输出：
9
假若他
18
日相逢
25

我将
34
何以贺
41
你
以
48
沉默

57
以眼泪

文件的写操作-write

write(str): 把字符串写入文件
writeline(str): 把字符串按行写入文件
区别：
- write函数参数只能是字符串
- writerline参数可以是字符串，也可以是字符序列

# write 案例
# 1. 向文件追加一句诗

# a代表追加方式打开
with open(r'test01.txt', 'a', encoding = 'UTF-8') as f:
    # 注意字符串内含有换行符
    f.write("生活不仅有眼前的苟且， \n 还有远方的苟且")

# 可以直接写入行， 用writelines
# writelines表示写入很多行，参数可以是list格式

# a代表追加方式打开
with open(r'test01.txt', 'a') as f:
    # 注意字符串内含有换行符
    f.writelines("生活不仅有眼前的苟且")
    f.writelines("还有远方的枸杞")

l = ["I", "love", "wangxiaojing"]

# a代表追加方式打开
with open(r'test01.txt', 'w') as f:
    # 注意字符串内含有换行符
    f.writelines(l)

持久化 - pickle

序列化（持久化，落地）：把程序运行中的信息保存在磁盘上
反序列化：序列号的逆过程
pickle： python提供的序列化模块
pickle.dump:序列化
pickle.load:反序列化

# 序列化案例
import pickle

age = 19

with open(r'test01.txt', 'wb', encoding = 'UTF-8') as f:
    pickle.dump(age, f)

# 反序列化案例

import pickle

with open(r'test01.txt', 'rb') as f:
    age = pickle.load(f)
    print(age)

输出：
19

# 序列化案例
import pickle

a = [19, 'liudana', "i love wangxiaojing", [185, 76]]

with open(r'test01.txt', 'wb') as f:
    pickle.dump(a, f)

with open(r'test01.txt', 'rb') as f:
    a  = pickle.load(f)
    print(a)

输出：
[19, ‘liudana’, ‘i love wangxiaojing’, [185, 76]]

持久化-shelve

持久化工具
类似字典，用kv对保存数据，存取方式跟字典也类似
open, close

# 使用shelve创建文件并使用
import shelve

# 打开文件
# shv相当于一个字典
shv = shelve.open(r'shv.db')

shv['one'] = 1
shv['two'] = 2
shv['three'] = 3

shv.close()

# 通过以上案例发现，shelve自动创建的不仅仅是一个shv.db文件，还包括其他格式文件

shelve打开了必须关闭
最好采用：**try…finally… **语句

# shelve读取案例
shv = shelve.open(r'shv.db')

try:
    print(shv['one'])
    print(shv['threee'])
except Exception as e:
    print("烦死了")
finally:
    shv.close()

输出：
1
烦死了

shelve特性

不支持多个应用并行写入
- 为了解决这个问题，open的时候可以使用flag=r
写回问题
- shelve恶魔人情况下不会等待持久化对象进行任何修改
- 解决方法：强制写回：writeback=True

# shelve 之只读打开
import shelve

shv = shelve.open(r'shv.db', flag='r')

try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出：
1

import shelve

 

shv = shelve.open(r'shv.db')
try:
    shv['one'] = {"eins":1, "zwei":2, "drei":3}
finally:
    shv.close()


shv = shelve.open(r'shv.db')
try:
    one = shv['one']
    print(one)
finally:
    shv.close()

输出：
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}

如果修改内容，需要使用强制写回，方法采用： writeback=True

# shelve忘记写回，需要使用强制写回
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
    # 此时，一旦shelve关闭，则内容还是存在于内存中，没有写回数据库
    k1["eins"] =100
finally:
    shv.close()
    
    
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出：
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}

# shelve忘记写回，需要使用强制写回
shv = shelve.open(r'shv.db', writeback=True)
try:
    k1 = shv['one']
    print(k1)
    # 此时，一旦shelve关闭，则内容还是存在于内存中，没有写回数据库
    k1["eins"] =100
finally:
    shv.close()
    
    
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出：
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}

# shelve 使用with管理上下文环境

with shelve.open(r'shv.db', writeback=True) as shv:
    k1 = shv['one']
    print(k1)
    # 此时，一旦shelve关闭，则内容还是存在于内存中，没有写回数据库
    k1["eins"] =1000

    
    
with shelve.open(r'shv.db') as shv:
    print(shv['one'])

输出：
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1000, ‘zwei’: 2, ‘drei’: 3}

json特性

JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。
JSON的数据格式其实就是python里面的字典格式，里面可以包含方括号括起来的数组，也就是python里面的列表。
Json 模块提供了四个方法： dumps、dump、loads、load

import json
x = [1,2,3]
y = json.dumps(x)
print(type(y))
json.loads(y)

输出：
<class ‘str’>
[1, 2, 3]

json的 dumps 和 dump:

dumps和dump 序列化方法

dumps只完成了序列化为str，
dump必须传文件描述符，将序列化的str保存到文件中

def dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
        allow_nan=True, cls=None, indent=None, separators=None,
        default=None, sort_keys=False, **kw):
    # Serialize ``obj`` to a JSON formatted ``str``.
    # 序列号 “obj” 数据类型 转换为 JSON格式的字符串

def dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,
        allow_nan=True, cls=None, indent=None, separators=None,
        default=None, sort_keys=False, **kw):
    """Serialize ``obj`` as a JSON formatted stream to ``fp`` (a
    ``.write()``-supporting file-like object).
     我理解为两个动作，一个动作是将”obj“转换为JSON格式的字符串，还有一个动作是将字符串写入到文件中，也就是说文件描述符fp是必须要的参数 """

实例：

>>> import json
>>> json.dumps([])    # dumps可以格式化所有的基本数据类型为字符串
'[]'
>>> json.dumps(1)    # 数字
'1'
>>> json.dumps('1')   # 字符串
'"1"'
>>> dict = {"name":"Tom", "age":23}  
>>> json.dumps(dict)     # 字典
'{"name": "Tom", "age": 23}'

a = {"name":"Tom", "age":23}
with open("test.json", "w", encoding='utf-8') as f:
    # indent 超级好用，格式化保存字典，默认为None，小于0为零个空格
    f.write(json.dumps(a, indent=4))
    # json.dump(a,f,indent=4)   # 和上面的效果一样

json的loads 和 load

loads和load 反序列化方法

loads 只完成了反序列化，
load 只接收文件描述符，完成了读取文件和反序列化

def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
    """Deserialize ``s`` (a ``str`` instance containing a JSON document) to a Python object.
       将包含str类型的JSON文档反序列化为一个python对象"""

def load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
    """Deserialize ``fp`` (a ``.read()``-supporting file-like object containing a JSON document) to a Python object.
        将一个包含JSON格式数据的可读文件饭序列化为一个python对象"""

实例：

>>> json.loads('{"name":"Tom", "age":23}')
{'age': 23, 'name': 'Tom'}

import json
with open("test.json", "r", encoding='utf-8') as f:
    aa = json.loads(f.read())
    f.seek(0)
    bb = json.load(f)    # 与 json.loads(f.read())
print(aa)
print(bb)

输出:
{‘name’: ‘Tom’, ‘age’: 23}
{‘name’: ‘Tom’, ‘age’: 23}

总结

1. json序列化方法：
  
  dumps：无文件操作 dump：序列化+写入文件
1. json反序列化方法：
  
  loads：无文件操作 load：读文件+反序列化

修改自图灵学院课程文件

CSV文件读写

csv（comma separeated values) 格式的文件常用于电子表格和数据库中的导入和导出。

csv.reader(fp,delimiter= ’ ‘,quotechar=’ ')
csv.writer(fp,delimiter=’ ‘, quotechar=’ ')
– writerrow( )
csv.DictReader(fp)
csv.DictWriter(fp,fieldnames=’ ')

戈扬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
PYTHON 之文件操作

文件转载自图灵学院课程长久保存信息的一种数据信息集合常用操作打开关闭（文件一旦打开，需要关闭操作）读写内容查找open函数open函数负责打开文件，带有很多参数第一个参数：必须有，文件的路径和名称mode：表明文件用什么方式打开r:以只读方式打开w：写方式打开，会覆盖以前的内容x：创建方式打开，如文件已经存在，报错a：append方式，以追加的方式对文件...
复制链接

扫一扫