1、从文件中读取数据
读取整个文件:
先创建一个pi.txt文件,里面输入pi前一百位,并分隔为几段。
3.1415926535
897932384626
433832795028
841971693993
751058209749
445923078164
062862089986
280348253421
170679
创建下面程序,以下程序打开并读取文件,并将内容显示出来。
file_reader.py
with open('pi.txt') as file_object:
contents = file_object.read()
print(contents)
在这个程序中。函数open() 接受一个参数:要打开的文件的名称。Python在当前执行的文件所在的目录中查找指定的文件。在这个示例中,当前运行的是file_reader.py,因此Python在file_reader.py所在的目录中 查找pi.txt。函数open() 返回一个表示文件的对象。open('pi.txt') 返回一个表示文件pi.txt 的对象;Python将这个对象存储在后面使用的变量中。
关键字with 在不再需要访问文件后将其关闭。在这个程序中,注意到我们调用了open() ,但没有调用close() ;你也可以调用open() 和close() 来打开和关闭文件,但这样做时,如果程序存在bug,导致close() 语句未执行,文件将不会关闭。这看似微不足道,但未妥善地关闭文件可能会导致数据丢失或受损。如果在程序中过早地调 用close() ,你会发现需要使用文件时它已关闭 (无法访问),这会导致更多的错误。并非在任何情况下都能轻松确定关闭文件的恰当时机,但通过使用前面所示的结构,可让Python去确定:你只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭。
有了表示pi.txt的文件对象后,使用方法read() 读取这个文件的全部内容,并将其作为一个长长的字符串存储在变量contents 中。这样,通过 打印contents 的值,就可将这个文本文件的全部内容显示出来:
3.1415926535
897932384626
433832795028
841971693993
751058209749
445923078164
062862089986
280348253421
170679
文件路径:
当将类似pi.txt这样的简单文件名传递给函数open() 时,Python将在当前执行的文件(即.py程序文件)所在的目录中查找文件。要让Python打开不与程序文件位于同一个目录中的文件,需要提供文件路径 ,它让Python到系统的特定位置去查找。
由于文件夹text_files位于文件夹python_work中,因此可使用相对文件路径来打开该文件夹中的文件。相对文件路径让Python到指定的位置去查找,而该位置是相对于当前运行的程序所在目录的。在Linux和OS X中,你可以这样编写代码:
with open('text_files/filename.txt') as file_object:
在Windows系统中,在文件路径中使用反斜杠(\ )而不是斜杠(/ ):
with open('text_files\filename.txt') as file_object:
还可以将文件在计算机中的准确位置告诉Python,这样就不用关心当前运行的程序存储在什么地方了。这称为绝对文件路径 。在相对路径行不通时,可使用绝对路径。绝对路径通常比相对路径更长,因此将其存储在一个变量中,再将该变量传递给open() 会有所帮助。
逐行读取:
读取文件时,常常需要检查其中的每一行:可能要在文件中查找特定的信息,或者要以某种方式修改文件中的文本。要以每次一行的方式检查文件,可对文件对象使用for 循环:
filename = 'pi.txt'
with open(filename) as file_object:
for line in file_object:
print(line)
将要读取的文件的名称存储在变量filename 中,这是使用文件时一种常见的做法。由于变量filename 表示的并非实际文件——它只是一个让Python知道到哪里去查找文件的字符串,因此可轻松地将'pi.txt' 替换为你要使用的另一个文件的名称。调用open() 后,将一个表示文件及其内容的对象存储到了变 量file_object 中。这里也使用了关键字with ,让Python负责妥善地打开和关闭文件。为查看文件的内容,通过对文件对象执行循环来遍历文件中的每一行。
打印每一行时,发现空白行更多了:
3.1415926535
897932384626
433832795028
841971693993
751058209749
445923078164
062862089986
280348253421
170679
为何会出现这些空白行呢?因为在这个文件中,每行的末尾都有一个看不见的换行符,而print 语句也会加上一个换行符,因此每行末尾都有两个换行符:一个来自文件,另一 个来自print 语句。要消除这些多余的空白行,可在print 语句中使用rstrip() :
filename = 'pi.txt'
with open(filename) as file_object:
for line in file_object:
print(line.rstrip())
输出又与文件内容完全相同了:
3.1415926535
897932384626
433832795028
841971693993
751058209749
445923078164
062862089986
280348253421
170679
创建一个包含文件各行内容的列表:
使用关键字with 时,open() 返回的文件对象只在with 代码块内可用。如果要在with 代码块外访问文件的内容,可在with 代码块内将文件的各行存储在一个列表中,并在with 代码块外使用该列表。下面的示例在with 代码块中将文件pi.txt的各行存储在一个列表中,再在with 代码块外打印它们:
filename = 'pi.txt'
with open(filename) as file_object:
lines = file_object.readlines()
for line in lines:
print(line.rstrip())
方法readlines() 从文件中读取每一行,并将其存储在一个列表中;接下来,该列表被存储到变量lines 中;在with 代码块外,依然可以使用这个变量。然后使用一个简单的for 循环来打印lines 中的各行。由于列表lines 的每个元素都对应于文件中的一行,因此输出与文件内容完全一致。
使用文件的内容:
将文件读取到内存中后,就可以以任何方式使用这些数据了。下面以简单的方式使用圆周率的值。首先,我们将创建一个字符串,它包含文件中存储的所有数字,且没有任何空格: pi_string.py
filename = 'pi.txt'
with open(filename) as file_object:
lines = file_object.readlines()
pi_string = ''
for line in lines:
pi_string += line.rstrip()
print(pi_string)
print(len(pi_string))
首先打开文件,并将其中的所有行都存储在一个列表中。创建了一个变量——pi_string ,用于存储圆周率的值。接下来,使用一个循环将各行都加入pi_string ,并删除每行末尾的换行符。并打印这个字符串及其长度:
3.1415926535897932384626433832795028841971693993751058209749445923078164062862089986280348253421170679
102
如此获得了一个这样的字符串:它包含精确到100位小数的圆周率值。这个字符串长102字符,因为它还包含整数部分的3和小数点。
注意:读取文本文件时,Python将其中的所有文本都解读为字符串。如果你读取的是数字,并要将其作为数值使用,就必须使用函数int() 将其转换为整数,或使用 函数float() 将其转换为浮点数。
2、写入文件
写入空文件:
要将文本写入文件,在调用open() 时需要提供另一个实参,告诉Python要写入打开的文件。为明白其中的工作原理,将一条简单的消息存储到文件中,而不是将其打印到屏幕上:
filename = 'hobby.txt'
with open(filename, 'w') as file_object:
file_object.write("I love apple.")
在这个示例中,调用open() 时提供了两个实参。第一个实参也是要打开的文件的名称;第二个实参('w' )告诉Python,要以写入模式打开这个文件。打开文件时,可指定读取模式 ('r' )、写入模式 ('w' )、附加模式 ('a' )或让你能够读取和写入文件的模式('r+' )。
如果省略了模式实参,Python将以默认的只读模式打开文件。 如果要写入的文件不存在,函数open() 将自动创建它。然而,以写入('w' )模式打开文件时千万要小心,因为如果指定的文件已经存在,Python将在返回文件对象前清空该文件。 使用文件对象的方法write() 将一个字符串写入文件。这个程序没有终端输出,但如果打开文件hobby.txt,将看到其中包含如下一行内容:
I love apple.
注意:Python只能将字符串写入文本文件。要将数值数据存储到文本文件中,必须先使用函数str() 将其转换为字符串格式。
写入多行:
函数write() 不会在写入的文本末尾添加换行符,因此如果写入多行时没有指定换行符,要让每个字符串都单独占一行,需要在write() 语句中包含换行符:
filename = 'hobby.txt'
with open(filename, 'w') as file_object:
file_object.write("I love apple.\n")
file_object.write("I love banana.\n")
打开hobby.txt文件可看到:
I love apple.
I love banana.
附加到文件:
要给文件添加内容,而不是覆盖原有的内容,可以附加模式打开文件。以附加模式打开文件时,Python不会在返回文件对象前清空文件,而写入到文件的行都将添加到文件末尾。如果指定的文件不存在,Python将为你创建一个空文件。
filename = 'hobby.txt'
with open(filename, 'a') as file_object:
file_object.write("I also like to eat watermelon..\n")
file_object.write("I don't like lemons.\n")
打开文件时指定了实参'a' ,以便将内容附加到文件末尾,而不是覆盖文件原来的内容。又写入了两行,它们被添加到文件hobby.txt末尾:
打开hobby.txt:
I love apple.
I love banana.
I also like to eat watermelon..
I don't like lemons.
3、异常
Python使用被称为异常的特殊对象来管理程序执行期间发生的错误。每当发生让Python不知所措的错误时,它都会创建一个异常对象。如果编写了处理该异常的代码,程序将继续运行;如果未对异常进行处理,程序将停止,并显示一个traceback,其中包含有关异常的报告。
异常是使用try-except 代码块处理的。try-except 代码块让Python执行指定的操作,同时告诉Python发生异常时怎么办。使用了try-except 代码块时,即便出现异常, 程序也将继续运行:显示你编写的友好的错误消息,而不是令用户迷惑的traceback。
处理ZeroDivisionError 异常:
division.py
print(6/0)
执行会看到一个Traceback。
Traceback (most recent call last):
File "D:/pycharm/division.py", line 1, in <module>
print(6/0)
ZeroDivisionError: division by zero
在上述traceback中,指出的错误ZeroDivisionError 是一个异常对象。Python无法按你的要求做时,就会创建这种对象。在这种情况下,Python将停止运行程序,并指出 引发了哪种异常,而我们可根据这些信息对程序进行修改。
下面告诉Python,发生这种错误时怎么办。
使用try-except代码块:
当认为可能发生了错误时,可编写一个try-except 代码块来处理可能引发的异常。让Python尝试运行一些代码,并告诉它如果这些代码引发了指定的异常,该怎么办。 处理ZeroDivisionError 异常的try-except 代码块类似于下面这样:
try:
print(6/0)
except ZeroDivisionError:
print("You can't divide by zero!")
将导致错误的代码行print(6/0) 放在了一个try 代码块中。如果try 代码块中的代码运行起来没有问题,Python将跳过except 代码块;如果try 代码块中的代码导致了 错误,Python将查找这样的except 代码块,并运行其中的代码,即其中指定的错误与引发的错误相同。
在上面代码中,try 代码块中的代码引发了ZeroDivisionError 异常,因此Python指出了该如何解决问题的except 代码块,并运行其中的代码。这样,用户看到的是一条友 好的错误消息,而不是traceback:
You can't divide by zero!
使用异常避免崩溃:
发生错误时,如果程序还有工作没有完成,妥善地处理错误就尤其重要。这种情况经常会出现在要求用户提供输入的程序中;如果程序能够妥善地处理无效输入,就能再提示用 户提供有效输入,而不至于崩溃。 下面来创建一个只执行除法运算的简单计算器:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
if second_number == 'q':
break
answer = int(first_number) / int(second_number)
print(answer)
这个程序提示用户输入一个数字,并将其存储到变量first_number 中;如果用户输入的不是表示退出的q,就再提示用户输入一个数字,并将其存储到变 量second_number 中。接下来,我们计算这两个数字的商(即answer )。这个程序没有采取任何处理错误的措施,因此让它执行除数为0的除法运算时,它将崩溃:
Give me two numbers, and I'll divide them.
Enter 'q' to quit.
First number: 6
Second number: 0
Traceback (most recent call last):
File "D:/pycharm/division.py", line 18, in <module>
answer = int(first_number) / int(second_number)
ZeroDivisionError: division by zero
else代码块:
通过将可能引发错误的代码放在try-except 代码块中,可提高这个程序抵御错误的能力。错误是执行除法运算的代码行导致的,因此我们需要将它放到try-except 代码块 中。这个示例还包含一个else 代码块;依赖于try 代码块成功执行的代码都应放到else 代码块中:
print("Give me two numbers, and I'll divide them.")
print("Enter 'q' to quit.")
while True:
first_number = input("\nFirst number: ")
if first_number == 'q':
break
second_number = input("Second number: ")
if second_number == 'q':
break
try:
answer = int(first_number) / int(second_number)
except ZeroDivisionError:
print("You can't divide by 0!")
else:
print(answer)
让Python尝试执行try 代码块中的除法运算,这个代码块只包含可能导致错误的代码。依赖于try 代码块成功执行的代码都放在else 代码块中;在这个示例中,如 果除法运算成功,就使用else 代码块来打印结果。 except 代码块告诉Python,出现ZeroDivisionError 异常时该怎么办。如果try 代码块因除零错误而失败,我们就打印一条友好的消息,告诉用户如何避免这种错 误。程序将继续运行,用户根本看不到traceback。
try-except-else 代码块的工作原理大致如下:Python尝试执行try 代码块中的代码;只有可能引发异常的代码才需要放在try 语句中。有时候,有一些仅在try 代码块成功 执行时才需要运行的代码;这些代码应放在else 代码块中。except 代码块告诉Python,如果它尝试运行try 代码块中的代码时引发了指定的异常,该怎么办。
处理FileNotFoundError 异常:
使用文件时,一种常见的问题是找不到文件:你要查找的文件可能在其他地方、文件名可能不正确或者这个文件根本就不存在。对于所有这些情形,都可使用try-except 代码 块以直观的方式进行处理。
尝试读取一个不存在的文件。下面的程序尝试读取文件alice.txt的内容,但没有将这个文件存储在alice.py所在的目录中:
filename = 'alice.txt'
with open(filename) as f_obj:
contents = f_obj.read()
Python无法读取不存在的文件,因此它引发一个异常:
Traceback (most recent call last):
File "D:/pycharm/division.py", line 25, in <module>
with open(filename) as f_obj:
FileNotFoundError: [Errno 2] No such file or directory: 'alice.txt'
在上述traceback中,最后一行报告了FileNotFoundError 异常,这是Python找不到要打开的文件时创建的异常。在这个示例中,这个错误是函数open() 导致的,因此要处理 这个错误,必须将try 语句放在包含open() 的代码行之前:
filename = 'alice.txt'
try:
with open(filename) as f_obj:
contents = f_obj.read()
except FileNotFoundError:
msg = "Sorry, the file " + filename + " does not exist."
print(msg)
在这个示例中,try 代码块引发FileNotFoundError 异常,因此Python找出与该错误匹配的except 代码块,并运行其中的代码。最终的结果是显示一条友好的错误消息,而 不是traceback。
4、存储数据
使用json.dump()和json.load()
编写一个存储一组数字的简短程序,再编写一个将这些数字读取到内存中的程序。第一个程序将使用json.dump() 来存储这组数字,而第二个程序将使 用json.load() 。 函数json.dump() 接受两个实参:要存储的数据以及可用于存储数据的文件对象。下面演示了如何使用json.dump() 来存储数字列表:
import json
numbers = [1, 3, 5, 7, 9, 11]
filename = 'numbers.json'
with open(filename, 'w') as f_obj:
json.dump(numbers, f_obj)
先导入模块json ,再创建一个数字列表。指定了要将该数字列表存储到其中的文件的名称。通常使用文件扩展名.json来指出文件存储的数据为JSON格式。接 下来,以写入模式打开这个文件,让json 能够将数据写入其中。使用函数json.dump() 将数字列表存储到文件numbers.json中。 这个程序没有输出,但我们可以打开文件numbers.json,看看其内容。数据的存储格式与Python中一样:
[1, 3, 5, 7, 9, 11]
再编写一个程序,使用json.load() 将这个列表读取到内存中:
import json
filename = 'numbers.json'
with open(filename) as f_obj:
numbers = json.load(f_obj)
print(numbers)
这次以读取方式打开这个文件,因为Python只需读取这个文件。使用函数json.load() 加载存储在 numbers.json中的信息,并将其存储到变量numbers 中。最后,打印恢复的数字列表,看看它是否与number_writer.py中创建的数字列表相同:
[1, 3, 5, 7, 9, 11]
保存和读取用户生成的数据:
对于用户生成的数据,使用json 保存它们大有裨益,因为如果不以某种方式进行存储,等程序停止运行时用户的信息将丢失。下面来看一个这样的例子:用户首次运行程序时 被提示输入自己的名字,这样再次运行程序时就记住他了。
先存储用户的名字:
import json
username = input("What is your name? ")
filename = 'username.json'
with open(filename, 'w') as f_obj:
json.dump(username, f_obj)
print("We'll remember you when you come back, " + username + "!")
提示输入用户名,并将其存储在一个变量中。接下来,调用json.dump() ,并将用户名和一个文件对象传递给它,从而将用户名存储到文件中。然后,打印一条消息,指出我们存储了他输入的信息:
What is your name? zina
We'll remember you when you come back, zina!
现在再编写一个程序,向其名字被存储的用户发出问候:
import json
filename = 'username.json'
with open(filename) as f_obj:
username = json.load(f_obj)
print("Welcome back, " + username + "!")
使用json.load() 将存储在username.json中的信息读取到变量username 中。恢复用户名后,我们就可以欢迎用户回来了:
Welcome back, zina!
5、小结
在本章中,学习了:如何使用文件;如何一次性读取整个文件,以及如何以每次一行的方式读取文件的内容;如何写入文件,以及如何将文本附加到文件末尾;什么是异常以 及如何处理程序可能引发的异常;如何存储Python数据结构,以保存用户提供的信息,避免用户每次运行程序时都需要重新提供。