PYTHON 之 文件 操作

文件

  • 长久保存信息的一种数据信息集合
  • 常用操作
    • 打开关闭(文件一旦打开,需要关闭操作)
    • 读写内容
    • 查找

open函数

  • open函数负责打开文件,带有很多参数

  • 第一个参数: 必须有,文件的路径和名称

  • mode:表明文件用什么方式打开

    • r:以只读方式打开
    • w:写方式打开,会覆盖以前的内容
    • x:创建方式打开,如文件已经存在,报错
    • a:append方式,以追加的方式对文件内容进行写入
    • b: binary方式,二进制方式写入
    • t: 文本方式打开
    • +: 可读写
  • open(file, mode=‘r’, buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

    • 注意:中文必须加上: encoding = ‘UTF-8’
# 打开文件,用写的方式
# r表示后面字符串内容不需要转义
# f称之为文件句柄
f = open(r"test01.txt", 'w')
# 文件打开后必须关闭
f.close()

# 此案例说明,以写方式打开文件,默认是如果没有文件,则创建

注意:此案例说明,以写方式打开文件,默认是如果没有文件,则创建

with语句

  • with语句使用的技术是一种成为上下文管理协议的技术(ContextManagementProtocal)
  • 自动判断文件的 作用域, 自动关闭不在使用的打开的文件句柄
    建议用with语句
  • r"test01.txt"中的r表示原义
# with语句案例

with open(r"test01.txt", 'r') as f:
    pass
    # 下面语句块开始对文件f进行操作
    # 在本模块中不需要在使用close关闭文件f

readline函数用来一行一行的读取文件

# with案例

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # 按行读取内容
    strline = f.readline()
    # 此结构保证能够完整读取文件知道结束
    while strline:
        print(strline)
        strline = f.readline()

输出:

假若他日相逢

我将何以贺你

以沉默

以眼泪

list能用打开的文件作为参数,把文件内每一行内容作为一个元素

# list能用打开的文件作为参数,把文件内每一行内容作为一个元素

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # 以打开的文件f作为参数,创建列表
    l = list(f)
    for line in l:
        print(line)

输出:

假若他日相逢

我将何以贺你

以沉默

以眼泪

read是按字符读取文件内容

  • read( )表示从文件头读到文件尾
  • read(n)表示读n个字符,一个汉字包含3个字节
  • read 可以与tell以及seek函数联合,获取任意地址的文件内容
# read是按字符读取文件内容
# 允许输入参数决定读取几个字符,
# 如果没有指定参数,从当前位置读取到结尾
# 否则,从当前位置读取指定个数字符

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(1)
    print(len(strChar))
    print(strChar)
    
# 作业:
# 使用read读取文件,每次读取一个,使用循环读完
# 尽量保持格式

输出:
1

作业: 使用read读取文件,每次读取一个,使用循环读完

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    i = f.read(1)
    while i:
      print(i)
      i = f.read(1)

seek(offset, from)

  • 移动文件的读取位置,也叫读取指针
  • from的取值范围:
    • 0: 从文件头开始偏移
    • 1:从文件当前位置开始偏移
    • 2: 从文件末尾开始偏移
  • 移动的单位是字节(byte)
  • 一个汉字由若干个字节构成
  • 返回文件只针对 当前位置
# seek案例
# 打开文件后,从第5个字节出开始读取

# 打开读写指针在0处, 即文件的开头
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # seek移动单位是字节
    f.seek(6, 0)
    strChar = f.read()
    print(strChar)

输出:
他日相逢
我将何以贺你
以沉默
以眼泪

# 关于读取文件的练习
# 打开文件,三个字符一组读出内容,然后显示在屏幕上
# 每读一次,休息一秒钟

# 让程序暂停,可以使用time下的sleep函数
import time

with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    # read参数的单位是字符,可以理解成一个汉字就是一个字符
    strChar = f.read(3)
    while strChar:
        print(strChar)
        # sleep参数单位是秒
        time.sleep(1)
        strChar = f.read(3)
# 作业:
# 解释以下运行结果,为什么不是每行三个字符

回答:换行符和空格符也算做一个字符
输出:
假若他
日相逢

我将
何以贺


沉默

以眼泪

UTF-8中的中文字符占用3个字节
  • 查看每个字符的二进制输出
# 每个字符的二进制内容
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(3)
    for i in strChar:
        print(type(i))
        print(len(i))
        j = bytes(i,'UTF-8')
        for k in j:
           print(bin(k))

输出:
<class ‘str’>
1
0b11101111
0b10111011
0b10111111
<class ‘str’>
1
0b1010
<class ‘str’>
1
0b11100101
0b10000001
0b10000111

tell函数: 用来显示文件读写指针的当前位置

  • 用法:pos = f.tell( )
# tell函数: 用来显示文件读写指针的当前位置
with open(r'test01.txt', 'r', encoding = 'UTF-8') as f:
    strChar = f.read(3)
    pos = f.tell()
    
    while strChar:
        print(pos)
        print(strChar)
        
        strChar = f.read(3)
        pos = f.tell()
        
# 以下结果说明:
# tell的返回数字的单位是byte
# read是以字符为单位

输出:
9
假若他
18
日相逢
25

我将
34
何以贺
41


48
沉默

57
以眼泪

文件的写操作-write

  • write(str): 把字符串写入文件
  • writeline(str): 把字符串按行写入文件
  • 区别:
    • write函数参数只能是字符串
    • writerline参数可以是字符串,也可以是字符序列
# write 案例
# 1. 向文件追加一句诗

# a代表追加方式打开
with open(r'test01.txt', 'a', encoding = 'UTF-8') as f:
    # 注意字符串内含有换行符
    f.write("生活不仅有眼前的苟且, \n 还有远方的苟且")
# 可以直接写入行, 用writelines
# writelines表示写入很多行,参数可以是list格式

# a代表追加方式打开
with open(r'test01.txt', 'a') as f:
    # 注意字符串内含有换行符
    f.writelines("生活不仅有眼前的苟且")
    f.writelines("还有远方的枸杞")
    
l = ["I", "love", "wangxiaojing"]

# a代表追加方式打开
with open(r'test01.txt', 'w') as f:
    # 注意字符串内含有换行符
    f.writelines(l)

持久化 - pickle

  • 序列化(持久化,落地):把程序运行中的信息保存在磁盘上
  • 反序列化: 序列号的逆过程
  • pickle: python提供的序列化模块
  • pickle.dump:序列化
  • pickle.load:反序列化
# 序列化案例
import pickle

age = 19

with open(r'test01.txt', 'wb', encoding = 'UTF-8') as f:
    pickle.dump(age, f)
# 反序列化案例

import pickle

with open(r'test01.txt', 'rb') as f:
    age = pickle.load(f)
    print(age)

输出:
19

# 序列化案例
import pickle

a = [19, 'liudana', "i love wangxiaojing", [185, 76]]

with open(r'test01.txt', 'wb') as f:
    pickle.dump(a, f)
with open(r'test01.txt', 'rb') as f:
    a  = pickle.load(f)
    print(a)

输出:
[19, ‘liudana’, ‘i love wangxiaojing’, [185, 76]]

持久化-shelve

  • 持久化工具
  • 类似字典,用kv对保存数据,存取方式跟字典也类似
  • open, close
# 使用shelve创建文件并使用
import shelve

# 打开文件
# shv相当于一个字典
shv = shelve.open(r'shv.db')

shv['one'] = 1
shv['two'] = 2
shv['three'] = 3

shv.close()

# 通过以上案例发现,shelve自动创建的不仅仅是一个shv.db文件,还包括其他格式文件
  • shelve打开了必须关闭
  • 最好采用:**try…finally… **语句
# shelve读取案例
shv = shelve.open(r'shv.db')

try:
    print(shv['one'])
    print(shv['threee'])
except Exception as e:
    print("烦死了")
finally:
    shv.close()

输出:
1
烦死了

shelve特性

  • 不支持多个应用并行写入
    • 为了解决这个问题,open的时候可以使用flag=r
  • 写回问题
    • shelve恶魔人情况下不会等待持久化对象进行任何修改
    • 解决方法: 强制写回:writeback=True
# shelve 之只读打开
import shelve

shv = shelve.open(r'shv.db', flag='r')

try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出:
1

import shelve

 

shv = shelve.open(r'shv.db')
try:
    shv['one'] = {"eins":1, "zwei":2, "drei":3}
finally:
    shv.close()


shv = shelve.open(r'shv.db')
try:
    one = shv['one']
    print(one)
finally:
    shv.close()

输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}

如果修改内容,需要使用强制写回,方法采用: writeback=True
# shelve忘记写回,需要使用强制写回
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
    # 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
    k1["eins"] =100
finally:
    shv.close()
    
    
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}

# shelve忘记写回,需要使用强制写回
shv = shelve.open(r'shv.db', writeback=True)
try:
    k1 = shv['one']
    print(k1)
    # 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
    k1["eins"] =100
finally:
    shv.close()
    
    
shv = shelve.open(r'shv.db')
try:
    k1 = shv['one']
    print(k1)
finally:
    shv.close()

输出:
{‘eins’: 1, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}

# shelve 使用with管理上下文环境

with shelve.open(r'shv.db', writeback=True) as shv:
    k1 = shv['one']
    print(k1)
    # 此时,一旦shelve关闭,则内容还是存在于内存中,没有写回数据库
    k1["eins"] =1000

    
    
with shelve.open(r'shv.db') as shv:
    print(shv['one'])

输出:
{‘eins’: 100, ‘zwei’: 2, ‘drei’: 3}
{‘eins’: 1000, ‘zwei’: 2, ‘drei’: 3}

json特性

  • JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。
  • JSON的数据格式其实就是python里面的字典格式,里面可以包含方括号括起来的数组,也就是python里面的列表。
  • Json 模块提供了四个方法: dumps、dump、loads、load
import json
x = [1,2,3]
y = json.dumps(x)
print(type(y))
json.loads(y)

输出:
<class ‘str’>
[1, 2, 3]

json的 dumps 和 dump:

dumps和dump 序列化方法
  • dumps只完成了序列化为str,
  • dump必须传文件描述符,将序列化的str保存到文件中
def dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
        allow_nan=True, cls=None, indent=None, separators=None,
        default=None, sort_keys=False, **kw):
    # Serialize ``obj`` to a JSON formatted ``str``.
    # 序列号 “obj” 数据类型 转换为 JSON格式的字符串 
def dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,
        allow_nan=True, cls=None, indent=None, separators=None,
        default=None, sort_keys=False, **kw):
    """Serialize ``obj`` as a JSON formatted stream to ``fp`` (a
    ``.write()``-supporting file-like object).
     我理解为两个动作,一个动作是将”obj“转换为JSON格式的字符串,还有一个动作是将字符串写入到文件中,也就是说文件描述符fp是必须要的参数 """

实例:

>>> import json
>>> json.dumps([])    # dumps可以格式化所有的基本数据类型为字符串
'[]'
>>> json.dumps(1)    # 数字
'1'
>>> json.dumps('1')   # 字符串
'"1"'
>>> dict = {"name":"Tom", "age":23}  
>>> json.dumps(dict)     # 字典
'{"name": "Tom", "age": 23}'
a = {"name":"Tom", "age":23}
with open("test.json", "w", encoding='utf-8') as f:
    # indent 超级好用,格式化保存字典,默认为None,小于0为零个空格
    f.write(json.dumps(a, indent=4))
    # json.dump(a,f,indent=4)   # 和上面的效果一样

json的loads 和 load

loads和load 反序列化方法
  • loads 只完成了反序列化,
  • load 只接收文件描述符,完成了读取文件和反序列化
def loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
    """Deserialize ``s`` (a ``str`` instance containing a JSON document) to a Python object.
       将包含str类型的JSON文档反序列化为一个python对象"""
def load(fp, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw):
    """Deserialize ``fp`` (a ``.read()``-supporting file-like object containing a JSON document) to a Python object.
        将一个包含JSON格式数据的可读文件饭序列化为一个python对象"""

实例:

>>> json.loads('{"name":"Tom", "age":23}')
{'age': 23, 'name': 'Tom'}
import json
with open("test.json", "r", encoding='utf-8') as f:
    aa = json.loads(f.read())
    f.seek(0)
    bb = json.load(f)    # 与 json.loads(f.read())
print(aa)
print(bb)

输出:
{‘name’: ‘Tom’, ‘age’: 23}
{‘name’: ‘Tom’, ‘age’: 23}

总结

    1. json序列化方法:

      dumps:无文件操作 dump:序列化+写入文件

    1. json反序列化方法:

      loads:无文件操作 load: 读文件+反序列化

修改自图灵学院课程文件

CSV文件读写

csv(comma separeated values) 格式的文件常用于电子表格和数据库中的导入和导出。

  • csv.reader(fp,delimiter= ’ ‘,quotechar=’ ')
  • csv.writer(fp,delimiter=’ ‘, quotechar=’ ')
    – writerrow( )
  • csv.DictReader(fp)
  • csv.DictWriter(fp,fieldnames=’ ')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值