为了巩固自己之前学习的知识,所以重新复习一下,第一个就先从文件的读写开始
文章目录
一、文件操作
1.打开文件
文件打开使用open()函数,open()函数包括两个常用参数一个是<name>文件名,<mode>是打开的方式,其中<mode>包含以下几种模式。
- 'r':以只读模式打开文件,仅允许读取文件内容,不允许更改
data = open('test.txt','r')
- 'w':只写模式,会删除原有内容,重新开始写,若文件不存在则会建立一个新文件
data = open('test.txt','w')
- 'a':追加文件内容,如果文件内容不存在则会新建一个文件
data = open('test.txt','a')
- 以上三种模式如果需要以二进制形式打开只需要在各自的模式种加一个b,例如'rb'就是以二进制读取文件,以二进制形式读取的文件通常是非文本的。
data = open('test.txt', 'rb')
为了保证中文字符的正常显示,通常在open()函数中多加一个参数encoding="utf8"
data = open('test.txt', 'r',encoding="utf8")
2.读写文件
上述open函数几种模式打开文件,仅仅是打开文件,要想对文件内容进行操作还需要读取进行读取。
常用的文件的读取包含三种方法read()、readline()、readlines()三种,为了看出他们的区别,我创建了如下内容的txt文件
- read(),将文件当作一整个的字符串直接全部读取出来
test = open('test.txt','r',encoding="utf8") data1 = test.read() print("\n",data1) # data2 = test.readline() # print("\n",data2) # data3 = test.readlines() # print("\n",data3)
输出结果如下
- readline():可以读取具体某一行其中的参数size就是指要读取的行。
test = open('test.txt','r',encoding="utf8")
# data1 = test.read()
# print("\n",data1)
data2 = test.readline()
print("\n",data2)
# data3 = test.readlines()
# print("\n",data3)
输出如下
- readlines(),将文件的每一行作为列表的一个元素输出。
test = open('test.txt','r',encoding="utf8") # data1 = test.read() # print("\n",data1) # data2 = test.readline() # print("\n",data2) data3 = test.readlines() print("\n",data3)
输出如下
看的出readlines()将文件内容按不同行组合成一个列表进行输出。
文件的写入有两种常用的方法:write和writelines,writelines仅对列表进行操作
3、文件的关闭
完成对文件的更改之后需要关闭文件,使用close方法即可
二、CSV文件
时间原因仅写常用的CSV文件读取方式
个人常用的读取方式是使用pandas库中的read_csv()函数进行读取。