前言
在本章中,将介绍处理文件,让文件能够快速地分析大量的数据。同时将学习异常,用于管理程序运行时出现的错误。这些知识点我们都不陌生,只需学习下基本语法就能掌握使用。
一、读取文件
要利用文本文件中的信息,我们首先需要将信息读取到内存中。在读取文件时可以一次性全部读取,也可以每次读取一行。
1.首先我们在D盘下创建一个文本文件pi_digits.txt
2.一次性读取整个文件,使用read()方法,使用关键字with不再需要访问文件后将其关闭,你只管打开文件,并在需要时使用它,Python自会在合适的时候将其关闭。
注意:指定文件路径的时候,由于反斜杠在Python中被视为转义标记,为在Windows中确保万无一失,应以原始字符串的方式指定路径,即在单引号前面加上r。
3.逐行读取,使用for循环读取文本文件的每一行。
4.创建一个包含文件各行内容的列表,使用readlines()方法从文件中读取到每一行,并将其存储到一个列表中,该列表被存储到变量lines中。
二、写入文件
保存数据最简单的方式之一就是将其写入到文件中。通过将输出写入文件,实现数据的持久化保存。有需要时在把这些数据读出来使用就可以。如果要写入文件,则需要在open()时提供另外一个实参,即读取模式。如果省略了模式实参,python将以默认的只读模式打开文件。
r:读取模式(默认)
w:写入模式(会覆盖之前的内容)
a:附加模式
r+:读写模式
1.下面我们以写入模式往文件中写入数据。写入模式的特点是写入前会清空该文件之前的内容,即这次写入会覆盖之前的文件内容。
#写入文件 r:读取模式(默认) w:写入模式(会覆盖之前的内容) a:附加模式 r+:读写模式
#如果要写入的文件不存在,函数open将会自动创建它
filename=r'D:\test.txt'
with open(filename,'w') as file_object:
file_object.write('I love python\n')
file_object.write('I love java\n')
2.有时候我们不需要覆盖之前的内容,即往文件后面追加内容,我们可以使用附加模式。
#附加模式,不会覆盖原来的内容,如果要写入的文件不存在,python将会创建一个空文件
filename=r'D:\test.txt'
with open(filename,'a') as file_object:
file_object.write('I love C\n')
file_object.write('I love C++\n')
可以看到我们这次写入的内容没有覆盖之前的,原内容仍然存在。
三、异常处理
Python使用异常对象来管理程序执行期间发生的错误。如果你编写了处理异常的代码,程序将继续运行。如果未对异常进行处理,程序将停止,并显示一个traceback,其中包含有关异常的报告。
1.下面来看一下如果发生错误,没有使用异常处理的情况。发生错误的代码是print(5/0),发生错误后,由于没有异常处理,后面的代码块没有执行。
2.下面来看一下使用了异常处理之后的情况。即使print(5/0)发生了错误,后面的代码块仍能正常运行。
3.结合else代码块,将可能引发错误的代码放在try-except代码块中,而一旦try中的代码块成功执行后,else代码块将会执行。
#else代码块,try成功执行的代码都应放到else中去
try:
first_number=int(input('请输入第一个数'))
second_number=int(input('请输入第二个数'))
result=first_number/second_number
except:
print('除0错误')
else:
print('两数相除的结果是:'+str(result))
如果代码执行正确,则执行else代码块。
如果代码执行错误,将不执行else代码块。
4.除了除0异常之外,还有文件找不到异常,即根据提供的路径无法找到该文件。
如果我们希望发生异常时,不做任何处理,可在except中使用pass语句。
四、分析文本
我们可以分析一个文本,尝试统计计算它包含多少个单词。我们将使用方法split()方法,根据字符串创建一个单词列表。
1.文本文件内容如下所示
2.分析文本代码
try:
filename=r'D:\Sweet Memory on Grandfather.txt'
with open(filename) as file_object:
contents=file_object.read()
except:
print('文件不存在')
else:
words=contents.split()
num_words=len(words)
print(words)
print('Sweet Memory on Grandfather has about '+str(num_words)+' word')
3.执行结果,可以看到这段文本共有56个单词。
五、json
使用模块json来存储数据是很简单的方式。模块json让你能够将简单的python数据结构转储到文件中。
扩展:json格式最初是为JavaScript开发的,但随后成了一种常见格式,包包括Python在内的众多语言使用。
1.使用json.dump()将数组列表写入到文件中,.json指出文件存储的数据为json格式。函数dump()接收两个实参:要存储的数据以及可用于存储数据的文件对象。
import json
filename=r'D:\number.json'
number=[1,2,3,4]
with open(filename,'w') as file_object:
json.dump(number,file_object)
2.使用json.load()将数据读取到内存中
3.综合案例,用户第一次登陆时输入用户名,并保持在username.json的文件中,后续登陆直接从文件中拿到用户名。
import json
def get_stored_username():
filename=r'D:\username.json'
try:
#如果文件不存在,出现了异常,即该用户是第一次登陆,返回一个None,否则直接返回用户名
with open(filename) as file_object:
username=json.load(file_object)
except:
return None
else:
return username
#创建一个 username.json的文件,保存用户名
def get_new_username():
filename=r'D:\username.json'
username=input('请输入你的姓名')
with open(filename,'w') as file_object:
json.dump(username,file_object)
return username
def greet_user():
username=get_stored_username()
#如果用户名不为空,即不为None,不是第一次登陆
if username:
print('欢迎回来'+username)
else:
#第一次登陆,需要输入用户名和创建文件
username=get_new_username()
print('这是你第一次使用,我们将会记住你的名字')
greet_user()
第一次登陆时:
同时生成了一个username.json的文件。
第二次登陆时:
总结
在本章中,介绍了如何读取以及写入文件,什么是异常以及如何处理程序可能引发的异常。同时介绍了一种json格式的数据,用它可以存储Python简单的数据结构。本章结束后,关于Python基础语法的讲解就可以先告一段落,总体来说在有java的基础之后,学习Python不会非常吃力,学习这些基础语法是为了后续章节的数据可视化做准备,所以一定要熟练掌握。