一、文件
1.文件的打开
# 文件的打开通用格式
with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:
"对文件进行相应的读写操作"
使用with 块的好处:执行完毕后,自动对文件进行close操作。
文件路径
程序与文件在同一文件夹,可简化为文件名,“.”表示当前路径,“…”表示上一个路径
打开模式
- “r” 只读模式,如文件不存在,报错
- “w” 覆盖写模式,如文件不存在,则创建;如文件存在,则完全覆盖原文件
- “x” 创建写模式,如文件不存在,则创建;如文件存在,报错
- “a” 追加写模式,如文件不存在,则创建;如文件存在,则在原文件后追加内容
- “b” 二进制文件模式,不能单独使用,需要配合使用如"rb",“wb”,“ab”,该模式不需指定encoding
- “t” 文本文件模式,默认值,需配合使用 如"rt",“wt”,“at”,一般省略,简写成如"r",“w”,“a”
- “+”,与"r",“w”,“x”,"a"配合使用,在原功能基础上,增加读写功能
- 打开模式缺省,默认为只读模式
字符编码
- 万国码——utf-8,包含全世界所有国家需要用到的字符
- 中文编码——中文编码gbk:专门解决中文编码问题
- window系统下,如果缺省(默认),则默认为gbk
- 为清楚起见,除了处理二进制文件,建议不要缺省encoding
# 第一步:打开文件
with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:
text = f.read() # 第二步:读取文件
print(text)
2.文件的读取
- 读取整个内容——f.read()
第一步:打开文件
with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:
text = f.read() # 第二步:读取文件
print(text)
- 逐行进行读取——f.readline()
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
for i in range(3):
text = f.readline() # 每次只读取一行
print(text)
- 读入所有行,以每行为元素形成一个列表——f.readlines()
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
text = f.readlines() # 注意每行末尾有换行符
print(text)
- 小结:文件比较大时,read()和readlines()占用内存过大,不建议使用,readline用起来不方便
with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
for text in f: # f本身就是一个可迭代对象,每次迭代读取一行内容
print(text)
- 二进制文件——图片
with open("test.jpg", "rb") as f:
print(len(f.readlines()))
3.文件的写入
- 向文件写入一个字符串或字节流(二进制)——f.write()
with open("恋曲1980.txt", "w", encoding="utf-8") as f:
f.write("你曾经对我说\n") # 文件不存在则立刻创建一个
f.write("你永远爱着我\n") # 如需换行,末尾加换行符\n
f.write("爱情这东西我明白\n")
f.write("但永远是什么\n")
- 追加模式——“a”
with open("恋曲1980.txt", "a", encoding="utf-8") as f:
f.write("姑娘你别哭泣\n")# 如果文件存在,新写入内容会覆盖掉原内容,一定要注意
f.write("我俩还在一起\n")
f.write("今天的欢乐\n")
f.write("将是明天创痛的回忆\n")
- 将一个元素为字符串的列表整体写入文件——f.writelines()
ls = ["春天刮着风", "秋天下着雨", "春风秋雨多少海誓山盟随风远去"]
with open("恋曲1980.txt", "w", encoding="utf-8") as f:
f.writelines(ls)
4.即读又写
- “r+”
如果文件名不存在,则报错;指针在开始,需要将指针移至末尾才能开始写,否则会覆盖前面的内容。
with open("浪淘沙_北戴河.txt", "r+", encoding="gbk") as f:
# for line in f:
# print(line) # 全部读一遍后,指针到达结尾
f.seek(0,2) # 或者可以将指针移到末尾f.seek(偏移字节数,位置(0:开始;1:当前位置;2:结尾))
text = ["萧瑟秋风今又是,\n", "换了人间。\n"]
f.writelines(text)
- “w+”
如果文件不存在,则会立即创建;如果文件存在,则立即清空原内容
with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
pass
with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
text = ["萧瑟秋风今又是,\n", "换了人间。\n"] # 清空原内容
f.writelines(text) # 写入新内容,指针在最后
f.seek(0,0) # 指针移到开始
print(f.read()) # 读取内容
- “a+”
若文件不存在,则创建;若文件存在,则指针在末尾,添加新内容,不会清空原内容
with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
f.seek(0,0) # 指针移到开始
print(f.read()) # 读取内容
with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
text = ["萧瑟秋风今又是,\n", "换了人间。\n"]
f.writelines(text) # 指针在最后,追加新内容,
f.seek(0,0) # 指针移到开始
print(f.read()) # 读取内容
5.数据的存储与读取
通用的数据格式可以在不同的语言中加载与存储
- csv格式
由逗号将数据分开的字符序列,可以由excel打开
读取
with open("成绩.csv", "r", encoding="gbk") as f:
ls = []
for line in f: # 逐行读取
ls.append(line.strip("\n").split(","))# 去掉每行的换行符,然后用“,”进行分割
for res in ls:
print(res)
写入
ls = [['编号', '数学成绩', '语文成绩'], ['1', '100', '98'], ['2', '96', '99'], ['3', '97', '95']]
with open("score.csv", "w", encoding="gbk") as f: # encoding="utf-8"中文出现乱码
for row in ls: # 逐行写入
f.write(",".join(row)+"\n") # 用逗号组合成字符串形式,末尾加换行符
- json格式
常被用来储存字典格式
写入——dump()
import json
scores = {"Petter":{"math":96 , "physics": 98},
"Paul":{"math":92 , "physics": 99},
"Mary":{"math":98 , "physics": 97}}
with open("score.json", "w", encoding="utf-8") as f: # 写入整个对象
# indent 表示字符串换行+缩进 ensure_ascii=False 显示中文
json.dump(scores, f, indent=4, ensure_ascii=False)
读取——load()
with open("score.json", "r", encoding="utf-8") as f:
scores = json.load(f) # 加载整个对象
for k,v in scores.items():
print(k,v)
# Petter {'math': 96, 'physics': 98}
# Paul {'math': 92, 'physics': 99}
# Mary {'math': 98, 'physics': 97}
二、异常处理
1.常见异常的产生
- 1、除0运算——ZeroDivisionError
- 2、找不到可读文件——FileNotFoundError
- 3、值错误——ValueError——传入一个调用者不期望的值,即使这个值的类型是正确的
- 4、索引错误——IndexError——下标超出序列边界
- 5、类型错误——TypeError——传入对象类型与要求不符
- 6、其他常见的异常类型——NameError 使用一个未被定义的变量,KeyError 试图访问字典里不存在的键
2.异常的处理
- try_except
如果try内代码块顺利执行,except不被触发
如果try内代码块发生错误,触发except,执行except内代码块
单分支
x = 10
y = 0
try:
z = x/y
except ZeroDivisionError: # 一般来说会预判到出现什么错误
# z = x/(y+1e-7)
# print(z)
print("0不可以被除!")
多分支
ls = []
d = {"name": "大杰仔"}
try:
y = m
# ls[3]
# d["age"]
except NameError:
print("变量名不存在")
except IndexError:
print("索引超出界限")
except KeyError:
print("键不存在")
万能异常 Exception (所有错误的老祖宗)
ls = []
d = {"name": "大杰仔"}
try:
# y = m
ls[3]
# d["age"]
except Exception:
print("出错啦")
捕获异常的值 as
ls = []
d = {"name": "大杰仔"}
# y = x
try:
y = m
# ls[3]
# d["age"]
except Exception as e: # 虽不能获得错误具体类型,但可以获得错误的值
print(e)
# name 'm' is not defined
- try_except_else
如果try 模块执行,则else模块也执行;可以将else 看做try成功的额外奖赏
try:
with open("浪淘沙_北戴河.txt") as f:
text = f.read()
except FileNotFoundError:
print("找不到该文件,ta是不是用了美颜?")
else:
for s in ["\n", ",", "。", "?"]: # 去掉换行符和标点符号
text = text.replace(s, "")
print("毛主席的名作《浪淘沙_北戴河》共由{}个字组成。".format(len(text)))
- try_except_finally
不论try模块是否执行,finally最后都执行
ls = []
d = {"name": "大杰仔"}
# y = x
try:
y = m
# ls[3]
# d["age"]
except Exception as e: # 虽不能获得错误具体类型,但可以获得错误的值
print(e)
finally:
print("不论触不触发异常,都将执行")
三、模块
1.模块导入
- 导入整个模块——import 模块名
- 从模块中导入类或函数——from 模块 import 类名或函数名
- 导入模块中所有的类和函数——from 模块 import *
2.模块的查找路径
- 1、内存中已经加载的模块
- 2、内置模块
# Python 启动时,解释器会默认加载一些 modules 存放在sys.modules中
# sys.modules 变量包含一个由当前载入(完整且成功导入)到解释器的模块组成的字典, 模块名作为键, 它们的位置作为值
import sys
print(len(sys.modules))
print("math" in sys.modules)
print("numpy" in sys.modules)
for k,v in list(sys.modules.items())[:20]:
print(k, ":", v)
- 3、sys.path路径中包含的模块
import sys
sys.path
sys.path的第一个路径是当前执行文件所在的文件夹
若需将不在该文件夹内的模块导入,需要将模块的路径添加到sys.path
import sys
sys.path.append("C:\\Users\\ibm\\Desktop") # 注意是双斜杠
import fun3
fun3.f3()