python基础知识10:io操作
1.前情回顾
- 经过我大概三天的休假,我回来继续学习python了。老师竟然批评我5555,不过这也是我为啥报名这个课程的原因呀,以后还是要天天来实验室,来实验室和在宿舍相比较就是你会发现明明是一样的时间,实验室却让你感觉时间很多的鸭子。
2.文件操作(IO技术)
- 数据库的底层也是IO操作
- 基本概念:
- 文本文件:存储的是普通“字符”文本,python 默认为 unicode 字符集(两个字节表示一个字符,最多可以表示:65536 个),word 软件编辑的文档
- 二进制文件:用“字节”进行存储,无法用记事本打开
- 文件操作相关模块:略
3.文本文件的写入操作
- 先默念一句:一切皆是对象
- 创建文件对象 open():open(文件名[,打开方式])
比如:D:\a\b.txt。为了减少“\”的输入,可以使用原始字符串:r“d:\b.txt”
- r:读 read 模式
- w:写 write 模式。如果文件不存在则创建;如果文件存在,则重写新内容;
- a:追加 append 模式。如果文件不存在则创建;如果文件存在,则在文件末尾追加内容
- b:二进制 binary 模式(可与其他模式组合使用),如果我们没有增加模式“b”,则默认创建的是文本文件对象
- +:读、写模式(可与其他模式组合使用)
- 写入数据:write()/writelines()写入数据
- write(a):把字符串 a 写入到文件中
- writelines(b):把字符串列表写入文件中,不添加换行符
- 关闭文件对象:close()关闭文件流
- 由于文件底层是由操作系统控制,所以我们打开的文件对象必须显式调用 close()方法关闭文件对象
- 为了确保打开的文件对象正常关闭,一般结合异常机制的 finally 或者 with 关键字实现无论何种情况都能关闭打开的文件对象。
try:
f = open(r"my01.txt","a")
str = "gaoqi"
f.write(str)
except BaseException as e:
print(e)
finally:
f.close()
5. with 语句(上下文管理器):
with 关键字(上下文管理器)可以自动管理上下文资源,不论什么原因跳出 with 块,都能确保文件正确的关闭
s = ["高淇\n","高老三\n","高老五\n"]
with open(r"d:\bb.txt","w") as f:
f.writelines(s)
3.常见编码
- 主要是因为GB2312,GBK,GB18030和UTF-8编码解码不一致导致
- windows 操作系统默认的编码是 GBK,Linux 操作系统默认的编码是 UTF-8。
- python默认的编码是unicode
- 右键File encoding
- 或者**,encoding=“utf-8”**
f = open(r"b.txt","w",encoding="utf-8")
f.write("尚学堂\n 百战程序员\n")
f.close()
4.文本文件的读取
- read([size])
从文件中读取 size 个字符,并作为结果返回。如果没有 size 参数,则读取整个文件。
读取到文件末尾,会返回空字符串。 - readline()
读取一行内容作为结果返回。读取到文件末尾,会返回空字符串。 - readlines()
文本文件中,每一行作为一个字符串存入列表中,返回该列表
5.enumerate()函数
6.二进制文件的读取和写入
- 记得加b
7.文件对象的常用属性和方法
- name 返回文件的名字
- mode 返回文件的打开模式
- closed 若文件被关闭则返回 True
- seek(offset[,whence]):把文件指针移动到新的位置,offset 表示相对于 whence 的多少个字节的偏移量;
offset:
off 为正往结束方向移动,为负往开始方向移动
whence 不同的值代表不同含义:
0: 从文件头开始计算(默认值)
1:从当前位置开始计算
2:从文件尾开始计算 - tell() :返回文件指针的当前位置
- flush() :把缓冲区的内容写入文件,但不关闭文件
- close() :把缓冲区内容写入文件,同时关闭文件,释放文件对象相关资源
8.使用pickle序列化
- 对象本质上就是一个“存储数据的内存块”。
- 有时候,我们需要将“内存块的数据”保存到硬盘上,或者通过网络传输到其他的计算机上。这时候,就需要“对象的序列化和反序列化”。
- 序列化指的是:将对象转化成“串行化”数据形式,存储到硬盘或通过网络传输到其他地方。反序列化是指相反的过程,将读取到的“串行化数据”转化成对象。
- 虽然反序列化出来的内容一样,但是是新的对象
- pickle.dump(obj, file) obj 就是要被序列化的对象,file 指的是存储的文件
pickle.load(file) 从 file 读取数据,反序列化成对象
9.CSV 文件的操作
- 可以表示表格的信息
- 值没有类型,所有值都是字符串
不能指定字体颜色等样式
不能指定单元格的宽高,不能合并单元格
没有多个工作表
不能嵌入图像图表
import csv
with open(r"d:\a.csv") as a:
a_csv = csv.reader(a)
headers = next(a_csv)
print(headers)
for row in a_csv:
print(row)
import csv
headers = ["工号","姓名","年龄","地址","月薪"]
rows = [("1001","高淇",18,"西三旗 1 号院","50000"),("1002","高八",19,"西三旗 1 号院","30000")]
with open(r"d:\b.csv","w") as b:
b_csv = csv.writer(b)
b_csv.writerow(headers)
b_csv.writerows(rows)
10.os 和 os.path 模块
- os 模块可以帮助我们直接对操作系统进行操作。
- os.system 可以帮助我们直接调用系统的命令
- os.startfile:直接调用可执行文件
- os 模块-文件和目录操作:
- os.path 模块提供了目录相关(路径判断、路径切分、路径连接、文件夹遍历)的操作
- os.walk()方法:返回一个 3 个元素的元组,(dirpath, dirnames, filenames),
dirpath:要列出指定目录的路径
dirnames:目录下的所有文件夹
filenames:目录下的所有文件
11.shutil 模块(拷贝和压缩)
- 拷贝
import shutil
shutil.copytree("电影/学习","音乐
",ignore=shutil.ignore_patterns("*.html","*.htm"))
- 压缩与解压缩
import shutil
import zipfile
import shutil
import zipfile
z2 = zipfile.ZipFile("a.zip","r")
z2.extractall("d:/")
z2.close()
12.递归算法
- 本质:“自己调用自己”
- 使用递归算法遍历目录下所有文件:
import os
allfile = []
def getFiles(path,level):
childFiles = os.listdir(path)
for file in childFiles:
filepath = os.path.join(path,file)
if os.path.isdir(filepath):
getFiles(filepath,level+1)
allfile.append("\t"*level+filepath)
getFiles(os.getcwd(),0)
for f in reversed(allfile):
print(f)