Python之文件、异常和模块

最新推荐文章于 2024-01-09 10:46:47 发布

刘大鸭

最新推荐文章于 2024-01-09 10:46:47 发布

阅读量264

点赞数

分类专栏： Python从头学文章标签： python csv

本文链接：https://blog.csdn.net/qq_36642243/article/details/108481558

版权

Python从头学专栏收录该内容

9 篇文章 2 订阅

订阅专栏

文件、异常和模块

一、文件
二、异常处理
- 2.1 常见异常的产生
- 2.2 异常的处理
三、模块简介

在这里插入图片描述

一、文件

实际应用中，我们绝大多数的数据都是通过文件的交互完成的

1.1 文件的打开

文件的打开通用格式

with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:
    "对文件进行相应的读写操作"
使用with 块的好处：执行完毕后，自动对文件进行close操作。

【例1】一个简单的文件读取

with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:     # 第一步：打开文件
    text = f.read()                                                   # 第二步：读取文件
    print(text)

output:
我是一个测试文件

1、文件路径

完整路径，如上例所示
程序与文件在同一文件夹，可简化成文件名

with open("测试文件.txt", "r", encoding = "gbk") as f: # 第一步：打开文件
    text = f.read()      # 第二步：读取文件
    print(text)

output:
我是一个测试文件

2、打开模式

“r” 只读模式，如文件不存在，报错
“w” 覆盖写模式，如文件不存在，则创建；如文件存在，则完全覆盖原文件
“x” 创建写模式，如文件不存在，则创建；如文件存在，报错
“a” 追加写模式，如文件不存在，则创建；如文件存在，则在原文件后追加内容
“b” 二进制文件模式，不能单独使用，需要配合使用如"rb"，“wb”，“ab”，该模式不需指定encoding
“t” 文本文件模式，默认值，需配合使用如"rt"，“wt”，“at”，一般省略，简写成如"r"，“w”，“a”
“+”，与"r",“w”,“x”,"a"配合使用，在原功能基础上，增加读写功能
打开模式缺省，默认为只读模式

3、字符编码

万国码 utf-8
包含全世界所有国家需要用到的字符
中文编码 gbk
专门解决中文编码问题

windows系统下，如果缺省，则默认为gbk（所在区域的编码）

为清楚起见，除了处理二进制文件，建议不要缺省encoding

1.2 文件的读取

1、读取整个内容——f.read()

with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:       # 第一步：打开文件
    text = f.read()                                                    # 第二步：读取文件
    print(text)

output:
临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。
青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

with open("三国演义片头曲_utf.txt", encoding="utf-8") as f:     # "r"，可缺省，为清晰起见，最好写上
    text = f.read()                                                   
    print(text)

解码模式不匹配

with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:     
    text = f.read()                                                    
    print(text)

output:
在这里插入图片描述

with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省，windows系统默认为"gbk"
    text = f.read()                                                    
    print(text)

output:
在这里插入图片描述
2、逐行进行读取——f.readline()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for i in range(3):
        text = f.readline()  # 每次只读取一行
        print(text)

output:
临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    while True:
        text = f.readline()
        if not text:
            # print(text is 2"")
            break
        else:
            # print(text == "\n")
            print(text, end="")      # 保留原文的换行，使print()的换行不起作用

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。

青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

3、读入所有行，以每行为元素形成一个列表——f.readlines()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
    text = f.readlines()              # 注意每行末尾有换行符
    print(text)

[‘临江仙·滚滚长江东逝水\n’, ‘滚滚长江东逝水，浪花淘尽英雄。\n’, ‘是非成败转头空。\n’, ‘\n’, ‘青山依旧在，几度夕阳红。\n’, ‘白发渔樵江渚上，惯看秋月春风。\n’, ‘一壶浊酒喜相逢。\n’, ‘古今多少事，都付笑谈中。\n’]

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for text in f.readlines():                                                   
        print(text)  # 不想换行则用print(text, end="")

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。

青山依旧在，几度夕阳红。

白发渔樵江渚上，惯看秋月春风。

一壶浊酒喜相逢。

古今多少事，都付笑谈中。

4、文本文件读取小结

文件比较大时，read()和readlines()占用内存过大，不建议使用

readline用起来又不太方便

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for text in f:  # f本身就是一个可迭代对象，每次迭代读取一行内容 
        print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。

青山依旧在，几度夕阳红。

白发渔樵江渚上，惯看秋月春风。

一壶浊酒喜相逢。

古今多少事，都付笑谈中。

5、二进制文件

图片：二进制文件

with open("test.jpg", "rb") as f:     
        print(len(f.readlines()))

output:
69

1.3 文件的写入

1、向文件写入一个字符串或字节流（二进制）——f.write()

with open("恋曲1980.txt", "w", encoding="utf-8") as f:                      
        f.write("你曾经对我说\n")        # 文件不存在则立刻创建一个
        f.write("你永远爱着我\n")        # 如需换行，末尾加换行符\n
        f.write("爱情这东西我明白\n")
        f.write("但永远是什么\n")

with open("恋曲1980.txt", "w", encoding="utf-8") as f:                      
        f.write("姑娘你别哭泣\n")        # 如果文件存在，新写入内容会覆盖掉原内容，一定要注意！！！
        f.write("我俩还在一起\n")        
        f.write("今天的欢乐\n")
        f.write("将是明天创痛的回忆\n")

2、追加模式——"a"

with open("恋曲1980.txt", "a", encoding="utf-8") as f:                      
        f.write("姑娘你别哭泣\n")        # 如果文件存在，新写入内容会覆盖掉原内容，一定要注意！！！
        f.write("我俩还在一起\n")        
        f.write("今天的欢乐\n")
        f.write("将是明天创痛的回忆\n")

3、将一个元素为字符串的列表整体写入文件——f.writelines()

ls = ["春天刮着风", "秋天下着雨", "春风秋雨多少海誓山盟随风远去"]
with open("恋曲1980.txt", "w", encoding="utf-8") as f:
    f.writelines(ls)

1.4 既读又写

1、"r+"

如果文件名不存在，则报错
指针在开始
要把指针移到末尾才能开始写，否则会覆盖前面内容

with open("浪淘沙_北戴河.txt", "r+", encoding="gbk") as f:
#     for line in f:
#         print(line)   # 全部读一遍后，指针到达结尾
    f.seek(0,2)         # 或者可以将指针移到末尾f.seek(偏移字节数,位置（0：开始；1：当前位置；2：结尾）)
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]
    f.writelines(text)

2、"w+"

若文件不存在，则创建
若文件存在，会立刻清空原内容！！！

with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
    pass

with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]  # 清空原内容
    f.writelines(text)                             # 写入新内容，指针在最后
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

3、"a+"

若文件不存在，则创建
指针在末尾，添加新内容，不会清空原内容

with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

output:
大雨落幽燕，
白浪滔天。
秦皇岛外打鱼船。
一片汪洋都不见，
知向谁边？
往事越千年，
魏武挥鞭，
东临碣石有遗篇。
萧瑟秋风今又是，
换了人间。

with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]  
    f.writelines(text)                             # 指针在最后,追加新内容， 
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

output:
大雨落幽燕，
白浪滔天。
秦皇岛外打鱼船。
一片汪洋都不见，
知向谁边？
往事越千年，
魏武挥鞭，
东临碣石有遗篇。
萧瑟秋风今又是，
换了人间。
萧瑟秋风今又是，
换了人间。

1.5 数据的存储与读取

通用的数据格式，可以在不同语言中加载和存储
本节简单了解两种数据存储结构csv和json

1、csv格式

由逗号将数据分开的字符序列，可以由excel打开

读取

with open("成绩.csv", "r", encoding="gbk") as f:
    ls = [] 
    for line in f:                              # 逐行读取
        ls.append(line.strip("\n").split(","))  # 去掉每行的换行符，然后用“,”进行分割
for res in ls:
    print(res)

output:
[‘编号’, ‘数学成绩’, ‘语文成绩’]
[‘1’, ‘100’, ‘98’]
[‘2’, ‘96’, ‘99’]
[‘3’, ‘97’, ‘95’]

写入

ls = [['编号', '数学成绩', '语文成绩'], ['1', '100', '98'], ['2', '96', '99'], ['3', '97', '95']]
with open("score.csv", "w", encoding="gbk") as f:   # encoding="utf-8"中文出现乱码
    for row in ls:                 # 逐行写入
        f.write(",".join(row)+"\n")   # 用逗号组合成字符串形式，末尾加换行符

也可以借助csv模块完成上述操作,eg:padas模块

2、json格式

常被用来存储字典类型

写入——dump()

import json

scores = {"Petter":{"math":96 , "physics": 98},
        "Paul":{"math":92 , "physics": 99},
        "Mary":{"math":98 , "physics": 97}}
with open("score.json", "w", encoding="utf-8") as f:             # 写入整个对象 
        # indent 表示字符串换行+缩进 ensure_ascii=False 显示中文
        json.dump(scores, f, indent=4, ensure_ascii=False)

读取——load()

with open("score.json", "r", encoding="utf-8") as f:                                         
        scores = json.load(f)           # 加载整个对象
        for k,v in scores.items():
            print(k,v)
Petter {'math': 96, 'physics': 98}
Paul {'math': 92, 'physics': 99}
Mary {'math': 98, 'physics': 97}

二、异常处理

2.1 常见异常的产生

1、除0运算——ZeroDivisionError

1/0

在这里插入图片描述

2、找不到可读文件——FileNotFoundError

with open("nobody.csv") as f:
    pass

在这里插入图片描述
3、值错误——ValueError

传入一个调用者不期望的值，即使这个值的类型是正确的

s = "1.3"
n = int(s)

在这里插入图片描述

4、索引错误——IndexError

下标超出序列边界

ls = [1, 2, 3]
ls[5]

在这里插入图片描述

5、类型错误——TypeError

传入对象类型与要求不符

1 + "3"

在这里插入图片描述

6、其他常见的异常类型

NameError 使用一个未被定义的变量
KeyError 试图访问字典里不存在的键

print(a)

在这里插入图片描述

d = {}
d["1"]

在这里插入图片描述
当异常发生的时候，如果不预先设定处理方法，程序就会中断

2.2 异常的处理

提高程序的稳定性和可靠性

1、try_except

如果try内代码块顺利执行，except不被触发
如果try内代码块发生错误，触发except,执行except内代码块
单分支

x = 10
y = 0
try:
    z = x/y
except ZeroDivisionError: # 一般来说会预判到出现什么错误
    # z = x/(y+1e-7)
    # print(z)
    print("0不可以被除！")

output:
0不可以被除！

x = 10
y = 0
try:
    z = x/y
except NameError:                  # 一般来说会预判到出现什么错误
    # z = x/(y+1e-7)
    # print(z)
    print("0不可以被除！")

在这里插入图片描述

多分支

ls = []
d = {"name": "大杰仔"}
try:
    y = m
    # ls[3]
    # d["age"]
except NameError:
    print("变量名不存在")
except IndexError:
    print("索引超出界限")
except KeyError:
    print("键不存在")

output:
变量名不存在

万能异常 Exception （所有错误的老祖宗）

ls = []
d = {"name": "大杰仔"}
try:
    # y = m
    ls[3]
    # d["age"]
except Exception:
    print("出错啦")

output:
出错啦

捕获异常的值 as

ls = []
d = {"name": "大杰仔"}
# y = x

try:
    y = m
    # ls[3]
    # d["age"]
except Exception as e:    # 虽不能获得错误具体类型，但可以获得错误的值
    print(e)

output:
name ‘m’ is not defined
2、try_except_else

如果try 模块执行，则else模块也执行
可以将else 看做try成功的额外奖赏

try:
    with open("浪淘沙_北戴河.txt") as f:
        text = f.read()
except FileNotFoundError:
    print("找不到该文件，ta是不是用了美颜？")
else:
    for s in ["\n", "，", "。", "？"]:         # 去掉换行符和标点符号
        text = text.replace(s, "")
    print("毛主席的名作《浪淘沙_北戴河》共由{}个字组成。".format(len(text)))

output:
毛主席的名作《浪淘沙_北戴河》共由65个字组成。

3、try_except_finally

不论try模块是否执行，finally最后都执行

ls = []
d = {"name": "大杰仔"}
# y = x
try:
    y = m
    # ls[3]
    # d["age"]
except Exception as e:    # 虽不能获得错误具体类型，但可以获得错误的值
    print(e)
finally:
    print("不论触不触发异常，都将执行")

output:
name ‘m’ is not defined
不论触不触发异常，都将执行

三、模块简介

已经被封装好

无需自己再“造轮子”

声明导入后，拿来即用

3.1 广义模块分类

1、Python 内置

时间库time\ 随机库random\ 容器数据类型collection\ 迭代器函数itertools

2、第三方库

数据分析numpy、pandas\ 数据可视化matplotlib\ 机器学习scikit-learn\ 深度学习Tensorflow

3、自定义文件

单独py文件
包——多个py文件

文件夹内多个py文件，再加一个__init__.py文件（内容可为空）

3.2 模块的导入

1、导入整个模块——import 模块名

调用方式：模块名.函数名或类名

import time

start = time.time()      # 调用time模块中的time()
time.sleep(3)            # 调用time模块中的sleep()  休息3秒钟
end = time.time()       
print("程序运行用时：{:.2f}秒".format(end-start))

output:
程序运行用时：3.00秒

import fun1
fun1.f1()

output:
导入fun1成功

2、从模块中导入类或函数——from 模块 import 类名或函数名

调用方式：函数名或类名

from itertools import product   

ls = list(product("AB", "123"))
print(ls)

output:
[(‘A’, ‘1’), (‘A’, ‘2’), (‘A’, ‘3’), (‘B’, ‘1’), (‘B’, ‘2’), (‘B’, ‘3’)]

from function.fun1 import f1         # 注意这种用法

f1()

output:
导入fun1成功

一次导入多个

from function import fun1, fun2

fun1.f1()
fun2.f2()

output:
导入fun1成功
导入fun2成功

**3、导入模块中所有的类和函数——from 模块 import ***

调用方式：函数名或类名

from random import * 

print(randint(1,100))       # 产生一个[1,100]之间的随机整数
print(random())             # 产生一个[0,1)之间的随机小数

output:
36
0.6582485822110181

3.3 模块的查找路径

模块搜索查找顺序：

1、内存中已经加载的模块

import fun1

fun1.f1()

导入fun1成功

# 删除硬盘上的fun1 文件
import fun1

fun1.f1()

导入fun1成功

# 修改硬盘上的fun1 文件
import fun1

fun1.f1()
# 居然没变，说明是优先从内存中读取的

导入fun1成功

2、内置模块

# Python 启动时，解释器会默认加载一些 modules 存放在sys.modules中
# sys.modules 变量包含一个由当前载入(完整且成功导入)到解释器的模块组成的字典, 模块名作为键, 它们的位置作为值
import sys

print(len(sys.modules))
print("math" in sys.modules)
print("numpy" in sys.modules)
for k,v in list(sys.modules.items())[:20]:
    print(k, ":", v)

output:

738
True
False
sys : <module 'sys' (built-in)>
builtins : <module 'builtins' (built-in)>
_frozen_importlib : <module 'importlib._bootstrap' (frozen)>
_imp : <module '_imp' (built-in)>
_thread : <module '_thread' (built-in)>
_warnings : <module '_warnings' (built-in)>
_weakref : <module '_weakref' (built-in)>
zipimport : <module 'zipimport' (built-in)>
_frozen_importlib_external : <module 'importlib._bootstrap_external' (frozen)>
_io : <module 'io' (built-in)>
marshal : <module 'marshal' (built-in)>
nt : <module 'nt' (built-in)>
winreg : <module 'winreg' (built-in)>
encodings : <module 'encodings' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\__init__.py'>
codecs : <module 'codecs' from 'C:\\Users\\ibm\\Anaconda3\\lib\\codecs.py'>
_codecs : <module '_codecs' (built-in)>
encodings.aliases : <module 'encodings.aliases' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\aliases.py'>
encodings.utf_8 : <module 'encodings.utf_8' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\utf_8.py'>
_signal : <module '_signal' (built-in)>
__main__ : <module '__main__'>

3、sys.path路径中包含的模块

import sys

sys.path

ouyput:
[‘E:\ipython’,
‘C:\Users\ibm\Anaconda3\python37.zip’,
…
‘C:\Users\ibm\.ipython’]

sys.path的第一个路径是当前执行文件所在的文件夹
若需将不在该文件夹内的模块导入，需要将模块的路径添加到sys.path

import sys

sys.path.append("C:\\Users\\ibm\\Desktop")    # 注意是双斜杠

import fun3

fun3.f3()

output:
导入fun3成功

刘大鸭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录