Python之文件和异常

文件和异常

接下来就该学习文件的处理,让程序能够快速地分析大量的数据;还将学习错误处理,避免程序在面对意外情形时崩溃;还将学习异常,它们是Python创建的特殊对象,用于管理程序运行时出现的错误;还将学习模块json,它能够保存用户数据,以免在程序停止运行后丢失。

1.从文件中读取数据

文本文件可存储的数据量多得难以置信:天气数据、交通数据、社会经济数据、文学作品等。每当需要需要分析或修改再文件中的信息时,读取文件都很有用,对数据分析应用程序来说尤其如此。比如,比可以编写一个这样的程序:读取一个文本文件的内容,重新设置这些数据的格式并将其写入文件,让浏览器能够显示这些内容。
要使用文本文件的信息,首先需要将信息读取到内存中。

1.1读取整个文件

那就先创建一个文本文件吧:
pi_digits.txt

3.1415926535
  8979323846
  2643383279

然后编写python脚本程序,来读取该文件:
file_reader.py

with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents)

还不错哦…

PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='51159'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.1415926535
  8979323846
  2643383279
  

在file_reader.py程序中,第一行代码做了大量的工作。**函数open()**接受一个参数:要打开的文件的名称。python在当前执行的文件所在的目录中查找指定的文件。函数open()返回一个表示文件的对象,在file_reader.py程序中返回的对象存储在file_object中。
关键字with在不再需要访问文件后将其关闭。在该程序中,注意到调用了open(),但没有调用close();也可以调用open()和close()来打开和关闭文件,但这样做时,如果程序存在bug,导致close()语句未执行,文件将不会关闭。这看似微不足道,但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早的调用close(),会发现需要使用文件时文件可能已经被关闭了。但是用当前的with的形式,可让python去确定关闭的时间:我们只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭。
拿到了pi_digits.txt的文件对象后,我们使用方法read()读取这个文件的全部内容,并将其作为一个长长的字符串存储在变量contents中,通过打印contents的值,就可以将这个文本文件中的内容显示出来。
有的时候打印出来的结果会有空行,是因为方法read()到达文件末尾时返回一个空字符串,而将这个空字符串显示出来时就是一个空行。那怎么删除这个空白行呢?大家是否还记得我们在前面说字符串的时候提到了一个方法,就是rstrip()方法:

with open('pi_digits.txt') as file_object:
    contents = file_object.read()
    print(contents.rstrip())
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='51159'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.1415926535
  8979323846
  2643383279

呢哦,现在没有空白行了吧!

1.2文件路径

在上面的例子中我们直接将pi_digits.txt这样的简单文件名传递给函数open()时,Python将当前执行的文件所在的目录中查找文件。
有时候文件会和编写的.py文件不在同一个目录下面,因为为了找到要操作的文件可使用相对文件路径来打开该文件夹中的文件。相对文件路径让python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。在linux和OS X中,可以如下形式编写代码:

with open('text_files/filename.txt')as file_object:

这行代码让python到文件夹python_work下的文件夹text_file中去查找指定的.txt文件,在Windows系统中,在文件路径中使用反斜杠(\)而不是斜杠(/):

with open('text_file\filename.txt') as file_object:

当然还可以把文件在计算机中的准确位置告诉python,这样就不用关心当前运行的程序存储在什么地方了,该准确路径称为绝对路径,在linux和OS X中,绝对路径如下编写:

with open('/home/ehmatthes/other_files/text_files/filename.txt') as file_object:

那再windows下面呢?因为前面说win和其它两个有些区别,再win中如下:

with opne('C:\Users\ehmatthes\other_files\text_files\filename.txt') as file_object:

上面的代码中,我们发现文件的绝对路径一般都很长,为了简便写,不用重复写很多遍,我们可以把绝对路径存储再一个变量中,如下:

file_path = '/home/ehmatthes/other_files/text_files/filename.txt'
file_path = 'C:\Users\ehmatthes\other_files\text_files\filename.txt'

注:Windows系统有时能够正确地解读文件路径中的斜杠。如果你使用的是windows系统,且结果不符合预期,请确保再文件路径中使用的是反斜杠。另外,由于反斜杠再Python中被视为转义标记,为在Windows中确保万无一失,应以原始字符串的方式指定路径,即在开头的单引号前加上r。

1.3逐行读取

读取文件时,常常需要检查其中的每一行:可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。比如,可能要遍历一个包含天气数据的文件,并使用天气描述中包含字样sunny的行。在新闻报道中,可能会查找包含标签的行,并按特定的格式设置它。
要以每次一行的方式检查文件,可对文件对象使用for循环:
file_reader.py

filename = 'pi_digits.txt'

with open(filename) as file_object:
    for line in file_object:
        print(line.rstrip())
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='53819'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.1415926535
  8979323846
  2643383279

1.4创建一个包含文件各行内容的列表

使用关键字with时,open()返回的文件对象只在with代码块内可用。如果要在with代码块外访问文件的内容,可在with代码块内将文件的各行存储在一个列表中,并在with代码块外使用该列表:你可以立即处理文件的各个部分,也可推迟到程序后面再处理。
下面的示例在with代码块中将文件pi_digits.txt的各行存储在一个列表中,再在with代码块外打印它们:

filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

for line in lines:
    print(line.rstrip())
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='54163'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.1415926535
  8979323846
  2643383279

方法readlines()从文件中读取每一行,并将其存储在一个列表中;接下来该列表被存储到变量lines中;在with代码块外,我们依然可以使用这个变量。

1.5使用文件的内容

将文件读取到内存中后,就可以以任何方式使用这些数据了。下面来举例,以简单的方式使用圆周率的值。首先,我们创建一个字符串,它包含文件中存储的所有数字,且没有任何空格:
pi_string.py

filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''

for line in lines:
    pi_string += line.rstrip()

print(pi_string)
print(len(pi_string))
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='55126'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.1415926535  8979323846  2643383279
36

在这个例子中,首先打开文件,并将其中的所有行都存储在一个列表中,接着创建一个变量-----pi_string,用于存储圆周率的值,然后使用循环将各行都加入pi_string,并删除了每行末尾的换行符。但我们发现在输出的结果中,还是有一个空格,那能不能把中间的空格给去掉呢?当然可以,程序就是来解决人类生活中的问题和改善人类生活的嘛。
在变量pi_string存储的字符串中,包含原来位于每行左边的空格,为删除这些空格,可使用strip(),不用rstrip():

filename = 'pi_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''

for line in lines:
    pi_string += line.strip()

print(pi_string)
print(len(pi_string))
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='55413'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
3.141592653589793238462643383279
32

怎么样?还可以吧,我们获得了一个包含精确到30位小数的圆周率值。这个字符串长32字符,包含了整数部分的3和小数点。
*注:读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用*函数int()将其转换为整数,或使用函数float()将其转换为浮点数

1.6包含一百万位的大型文件

上面的例子中都是一个只有三行的文本文件,但这些代码示例也可以处理非常大的文件。比如,有一个包含精确到小数点后1000000位而不是30位的圆周率值,也可以创建一个包含所有这些数字的字符串。

filename = 'D:\python\《Python编程》源代码文件-更新\《Python编程》源代码文件\chapter_10\pi_million_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''

for line in lines:
    pi_string += line.strip()

print(pi_string)
print(len(pi_string))
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='55545'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 

1000002

是不是很强大,确实挺厉害,并且运行时间也挺快的,对于你可以处理的数据量,Python没有任何限制;只要系统的内存足够大,想处理多少数据都可以。
我们看到输出的结果太长了,那要是只想输出部分怎么做呢?我们来看看怎么只输出部分:

filename = 'D:\python\《Python编程》源代码文件-更新\《Python编程》源代码文件\chapter_10\pi_million_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''

for line in lines:
    pi_string += line.strip()

print(pi_string[:52] + "...")
print(len(pi_string))

我们可以使用前面列表的切片方法,只输出前52个数值。

3.14159265358979323846264338327950288419716939937510...
1000002

1.7圆周率值中包含你的生日吗?

我们做个有趣的小实验,就是看看我们自己的生日是否包含在圆周率中,我们可将生日表示为一个由数字组成的字符串,再检查这个字符串是否包含在pi_string中:

filename = 'D:\python\《Python编程》源代码文件-更新\《Python编程》源代码文件\chapter_10\pi_million_digits.txt'

with open(filename) as file_object:
    lines = file_object.readlines()

pi_string = ''

for line in lines:
    pi_string += line.strip()

birthday = input("Please enter your birthday, in the form mmddyy: ")
if birthday in pi_string:
    print("Your birthday appears in the first million digits of pi!")
else:
    print("Your birthday does not appear in the first million digits of pi!")
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='55651'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
**Please enter your birthday, in the form mmddyy: 05042000
Your birthday does not appear in the first million digits of pi!**
PS C:\Users\Administrator>  ${env:DEBUGPY_LAUNCHER_PORT}='55663'; & 'C:\Users\Administrator\AppData\Local\Microsoft\WindowsApps\PythonSoftwareFoundation.Python.3.8_qbz5n2kfra8p0\python.exe' 'c:\Users\Administrator\.vscode\extensions\ms-python.python-2020.4.76186\pythonFiles\lib\python\debugpy\no_wheels\debugpy\launcher' 'c:\Users\Administrator\Desktop\python\0503\file_reader.py' 
**Please enter your birthday, in the form mmddyy: 120372
Your birthday appears in the first million digits of pi!**

练习:

filename = 'learning_python.txt'

with open(filename,encoding='utf8') as file_object:
    lines = file_object.readlines()

for line in lines:
    print(line.strip())

在这里有一个小插曲,因为在前面的章节中没有提到怎么读取中文,就是说中文和英文的提取是由区别的,关于字符编码的问题,在后续的章节中,会专门的一章节来说明和学习,这次的解决方法是在open()函数的参数里面加入encoding=‘utf8’,代表是utf压缩的,解压也需要使用utf8格式。
learning_python.txt

第一章:变量和简单数据类型
第二章:列表简介
第三章:操作列表
第四章:if语句
第五章:字典
第六章:用户输入和while循环
第七章:函数
第八章:类
第九章:文件和异常
第十章:测试代码

看看运行结果如何:

第一章:变量和简单数据类型
第二章:列表简介
第三章:操作列表
第四章:if语句
第五章:字典
第六章:用户输入和while循环
第七章:函数
第八章:类
第九章:文件和异常
第十章:测试代码
filename = 'learning_python.txt'

"""读取整个文件,并打印"""
with open(filename,encoding='utf8') as file_object:
    file = file_object.read()
    print(file)
print("\n")
"""读取整个文件,并逐行打印"""
with open(filename,encoding='utf8') as file_object:
    for line in file_object:
        print(line.rstrip())

print("\n")

"""读取整个文件,然后存储到一个列表中,逐行打印"""
with open(filename,encoding='utf8') as file_object:
    lines = file_object.readlines()

for line in lines:
    print(line.strip())
第一章:变量和简单数据类型
第二章:列表简介
第三章:操作列表
第四章:if语句
第五章:字典
第六章:用户输入和while循环
第七章:函数
第八章:类
第九章:文件和异常
第十章:测试代码


第一章:变量和简单数据类型
第二章:列表简介
第三章:操作列表
第四章:if语句
第五章:字典
第六章:用户输入和while循环
第七章:函数
第八章:类
第九章:文件和异常
第十章:测试代码


第一章:变量和简单数据类型
第二章:列表简介
第三章:操作列表
第四章:if语句
第五章:字典
第六章:用户输入和while循环
第七章:函数
第八章:类
第九章:文件和异常
第十章:测试代码

练习:
replace()方法,可将字符串中的特定单词都替换为另一个单词。比如:

>>> message = "I really like dogs."
>>> message.replace('dog','cat')
'I really like cats.'

learning_python.txt

In Python you can store as much information as you want.
In Python you can connect pieces of information.
In Python you can model real-world situations.

read_file.py

filename = 'learning_python.txt'
with open(filename) as f:
    lines = f.readlines()

for line in lines:
    # Get rid of newline, then replace Python with C.
    line = line.rstrip()
    print("Original: " + line)

print("\n")
print("below is new output!\n")

for line in lines:
    # Get rid of newline, then replace Python with C.
    line = line.rstrip()
    print(line.replace('Python', 'C'))

output:

Original: In Python you can store as much information as you want.
Original: In Python you can connect pieces of information.
Original: In Python you can model real-world situations.

below is new output!

In C you can store as much information as you want.
In C you can connect pieces of information.
In C you can model real-world situations.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值