python基础之Day12 文件操作(1)

一个完整的程序一般都包括数据的存储和读取; 但python 解释器执行完数据就消失了。实际开发中,经常需要从外部存储介质(硬盘、光盘、U 盘等)读取数据,或者将程序产生的数据存储到文件中,实现“持久化”保存。
很多软件系统是将数据存储的数据库中; 数据库实际也是基于文件形式存储的。

文本文件和二进制文件

数据组织形式储存打开软件
文本文件普通“字符文本”,默认unicode字符集( 2 16 2^{16} 216个字符)可用记事本打开
二进制文件用“字节”进行存储专用软件解码

二进制文件更为常见。

文件操作相关模块概述

名称说明
io 模块文件流的输入和输出操作 input output
os 模块基本操作系统功能,包括文件操作
glob 模块查找符合特定规则的文件路径名
fnmatch 模块使用模式来匹配文件路径名
fileinput 模块处理多个输入文件
filecmp 模块用于文件的比较
cvs 模块用于 csv 文件处理
pickle 和 cPickle用于序列化和反序列化
xml 包用于 XML 数据处理
bz2、 gzip、 zipfile、 zlib、 tarfile用于处理压缩和解压缩文件(分别对应不同的算法)

创建文件对象 open()

语法格式

open(文件名[,打开方式])

note:
1.文件名可以录入全路径,比如:D:\a\b\c.txt。为了减少“\”的输入,可以使用原始字符串:r“d:\b.txt”(路径前加上r),示例:f = open(r"D:\a\b\c.txt",“w”)
2.

打开方式描述
r读 read 模式
w写 write 模式。如果文件不存在则创建;如果文件存在,则重写新内容;
a追加 append 模式。如果文件不存在则创建;如果文件存在,则在文件末尾追加内容
b二进制 binary 模式(可与其他模式组合使用)
+读、写模式(可与其他模式组合使用)
  1. 如果我们没有增加模式“b”,则默认创建的是文本文件对象,处理的基本单元是“字符”。如果是二进制模式“b”,则创建的是二进制文件对象,处理的基本单元是“字节”。

文本文件的写入

创建文件对象
写入数据
关闭文件对象

需要关闭相关文件和操作系统的资源。

调用操作系统
PY文件
解释器执行文件
写入硬盘
f=open(r'E:\PycharmProjects\excpt\edit.txt','w')
f.write('yueyue is lively!')
f.close()

常用编码

一般项目都会使用 UTF-8。
在这里插入图片描述

中文乱码问题

windows 操作系统默认的编码是 GBK,Linux 操作系统默认的编码是 UTF-8。

Unicode执行
操作系统默认GBK编码
PY文件UTF-8解码
解释器调用操作系统
写入硬盘

可命令操作系统创建文件时用UTF-8

f=open(r'E:\PycharmProjects\excpt\edit.txt','w',encoding='utf-8')
f.write('悦悦最可爱!')
f.close()

write()/writelines()写入数据

write(a):把字符串a写入到文件中,每次写完会换行
writelines(b):把字符串列表b写入文件中,不会自动换行(即不添加换行符),而是将列表元素全部连接在一起。

f=open(r'E:\PycharmProjects\excpt\edit.txt','w',encoding='utf-8')
s1='yueyue\nlively\nsmart\n'
f.write(s1)
s2=['yueyue\n','lively\n','smart\n']
f.writelines(s2)
f.close()
# yueyue
# lively
# smart
# yueyue
# lively
# smart

close()关闭文件流

调用外部操作系统,会打开操作系统的相关资源和对象
python程序
在硬盘找到文件并操作
  1. 由于文件底层是由操作系统控制,故打开的文件对象必须显式调用 close()方法关闭文件对象利用try…finally结构或者 with 关键字实现
try:
    f=open('edit.txt','a')
    s=['a,s,d']
    f.writelines(s)
except BaseException as e:
    print(e)
finally:
    f.close()

在这里插入图片描述
2. 当调用 close()方法时, 首先会把缓冲区数据写入文件(也可以直接调用 flush()方法),再关闭文件,释放文件对象

with 语句(上下文管理器)

不论什么原因跳出 with 块,都能确保文件正确的关闭,并且可以在代码块执行完毕后自动还原进入该代码块时的现场。

s=['h','a','p','p','y']
with open('edit.txt','a') as f:
    f.writelines(s)

文本文件的读取

基本操作

方法说明示例
read([size])读取 size 个字符,并作为结果返回。默认读取整个文件。
读取到文件末尾,会返回空字符串。
f.read()
readline()读取一行内容作为结果返回。
读取到文件末尾,会返回空字符串。
f,readline()
readlines()文本文件中,每一行作为一个字符串存入列表中,返回该列表f,readlines()

note:中文也是每个字一个字符。

#读取前几个字符
with open(r'edit.txt','r',encoding='utf-8') as f:
    print(f.read(3))

#按行读取文件
#方法1
with open(r'edit.txt', 'r', encoding='utf-8') as f:
    for line in f:
        print(line,end='')  #文件每行末尾默认有换行符
#方法2
with open(r'edit.txt','r',encoding='utf-8') as f:
    while  True:
        line=f.readline()
        if not line:
            break
        else:
            print(line,end='')

为每一行加序号

enumerat()函数

将索引与对应列表元素以元组构成的enumerate对象返回

a=['yueyue','lively','cute','smart','happy']
b=enumerate(a)
print(b)
#<enumerate object at 0x0000024452213F48>
print(list(b))
#[(0, 'yueyue'), (1, 'lively'), (2, 'cute'), (3, 'smart'), (4, 'happy')]
c=[temp+'#'+str(index) for index,temp in enumerate(a)]
print(c)
#['yueyue#0', 'lively#1', 'cute#2', 'smart#3', 'happy#4']

文件示例

with open(r'edit.txt','r',encoding='utf-8') as f:
    lines=f.readlines()
    content=[temp.rstrip()+' '+str(index+1)+'\n' for index,temp in enumerate(lines)]
    print(content)

with open('edit2.txt','w',encoding='utf-8')as f:
    f.writelines(content)

二进制文件的读取和写入

二进制文件的处理流程和文本文件流程一致。需要指定二进制模式,从而创建出二进制文件对象。例如:
f = open(r"e:\a.txt", ‘wb’) #可写的、重写模式的二进制文件对象
f = open(r"e:\a.txt", ‘ab’) #可写的、追加模式的二进制文件对象
f = open(r"e:\a.txt", ‘rb’) #可读的二进制文件对象
note: \quad 创建好二进制文件对象后,仍然可以使用 write()、read()实现文件的读写操作。

with open(r'D:\桌面\11.jpg','rb') as f:
    with open('edit2.jpg','wb')as w:
        for line in f.readlines():
            w.write(line)

文件对象的常用属性和方法

文件对象封装了文件相关的操作。

文件对象的属性说明
name返回文件的名字
mode返回文件的打开模式
closed若文件被关闭则返回 True
文件对象的其他常用方法说明
seek(offset[,whence])把文件指针移动到新的位置, offset 表示相对于 whence 的多少个字节的偏移量;
offset:offset 为正往结束方向移动,为负往开始方向移动
whence 不同的值代表不同含义:
0: 从文件头开始计算(默认值)
1:从当前位置开始计算
2:从文件尾开始计算
tell()返回文件指针的当前位置
truncate([size])不论指针在什么位置,只留下指针前 size 个字节的内容,其余全部删除;如果没有传入 size,则当指针当前位置到文件末尾内容全部删除
flush()把缓冲区的内容写入文件,但不关闭文件
close()把缓冲区内容写入文件,同时关闭文件,释放文件对象相关资源

note: 上述说的是字节,utf-8中,一个汉字3个字节,一个字母一个字节,注意读取行的时候末尾还有换行符/n算两个字节

# yueyue
# lively
# cute
# smart
with open(r'edit.txt','r') as f:
    print('文件名:{}   文件打开模式:{}'.format(f.name,f.mode))
    #文件名:edit.txt   文件打开模式:rb
    print('指针的当前位置:{}'.format(f.tell()))
    #指针的当前位置:0
    print('第一行的内容:{}   当前位置:{}'.format(f.readline(),f.tell()))
    # 第一行的内容: yueyue
    # 当前位置:8
    print('第二行的内容:{}   当前位置:{}'.format(f.readline(), f.tell()))
    # 第二行的内容: lively
    # 当前位置:16
    f.seek(0)
    print('指针的当前位置:{}'.format(f.tell()))
    # 指针的当前位置:0

pickle 序列化

序列化指的是:将对象转化成“串行化”数据形式,存储到硬盘或通过网络传输到其他
地方。
反序列化:将读取到的“串行化数据”转化成对象。
示例:

序列化
反序列化
内存中的对象
存储在硬盘

pickle 模块中的函数,课实现序列化和反序列操作。

操作说明
pickle.dump(obj, file)obj 就是要被序列化的对象,file 指的是存储的文件
pickle.load(file)从 file 读取数据,反序列化成对象

note:反序列化取出的顺序和序列化存入的顺序是一致的。

import pickle
a1='yueyue'
a2='lively'
a3='happy'
with open('edit.gif','wb')as f:
    pickle.dump(a1,f)
    pickle.dump(a2, f)
    pickle.dump(a3, f)

with open('edit.gif','rb') as f:
    b1=pickle.load(f)
    b2= pickle.load(f)
    b3 = pickle.load(f)
    print(b1,b2,b3)#注意他和存入的顺序是一致的

print(id(a1),id(b1)) #虽然是序列化存入,反序列化取出,内容一样,但是不同的对象
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值