一,介绍
1.我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,
众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用
程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久
保存下来。
2.另外,在我们编写代码的时候,操作系统为了更快地做出响应,把当前的数据都放在内存中,因为内存和CPU的传输速度比硬
盘和CPU之间的传输速度快很多,但是一旦断电就没戏了,所以时刻记得保存文件。
3.有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:
#1. 打开文件,得到文件对象
#2. 对文件对象进行操作
#3. 关闭文件
二,打开文件及读取文件
语法:open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
目前只关注前三个参数
1.第一个是传入文件名,若只有文件名,不带路径的话,那么python会在当前目录中去找到该文件并打开
2.第二个是指定文件打开模式
3.第三个是编码格式
#1. 利用open()打开文件,得到文件对象并赋值给一个变量
f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r
#2. 对文件对象进行操作,例如读取
data=f.read()
#3. 关闭文件
f.close()
需要注意两各地方:
1.在操作完毕文件后,一定要记住f.close(),否则就会导致操作系统打开的文件还没有关闭,白白占用资源
2.python的默认编码格式为UTF-8
三,文件打开模式
#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】
a, 追加写模式【不可读;不存在则创建;存在则只追加内容】
x, 只写模式【不可读;不存在则创建,存在则报错】
rb
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码
#3. 了解部分
"+" 表示可以同时读写某个文件
r+, 读写【可读,可写】
w+,写读【可读,可写】
a+, 写读【可读,可写】
x+ ,写读【可读,可写】
四,文件对象方法
#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,从光标的位置向后读取,直到遇到\n结束
f.readlines() #读取每一行内容,存放于列表中
当然也可以直接迭代都出来,文件对象本身是支持迭代的直接使用for语句把内容迭代读取出来
f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) #文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式
#了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘
f.name
写入文件:
在写入前,请确认文件打开模式有'w'或'a',否则会出错:
>>> f = open("record.txt")
>>> f.write("这是一段写入的数据")
Traceback (most recent call last):
File "<pyshell#23>", line 1, in <module>
f.write("这是一段写入的数据")
io.UnsupportedOperation: not writable
>>>
以'w'模式打开
>>> f = open("record.txt","w")
>>> f.write("这是一段待写入的数据")
10
>>> f.close()
>>>
注意:'w'模式写入文件会把之前文件内容全部删除,如果要在之前的内容追加,可以使用'a'模式打开文件
#b的读取方式不能使用编码方式
#f = open('test.txt','rb',encoding='utf-8') #报错
f = open('test.txt','rb')
data = f.read()
print(data) #打印:b'hello1\r\n222222\r\n33333\r\n4444'
#'字符串'--encode-->>bytes二进制
#bytes --decode-->>'字符串'
f = open('test.txt','rb')
data = f.read()
print(data.decode('utf-8')) #打印:b'hello1\r\n222222\r\n33333\r\n4444'
f.close()
f = open('test.txt','wb')
f.write('1111\n')
f.close() #报错:TypeError: a bytes-like object is required, not 'str'
f = open('test.txt','wb')
f.write(bytes('1111\n',encoding='utf-8'))
#字符串转换成二进制形式:
#x ='hello'
#b = bytes(x,encoding='utf-8') #转化为二进制形式,必须先编码
f.write('美女'.encode('utf-8'))
#直接使用encode编码为二进制
f.close()
f =open('test.txt','ab')
f.write('帅哥'.encode('utf-8'))
f.close()
#若忘记关闭文件,可以使用with来打开文件,操作完后,默认关闭文件
with open('old_file.txt','r') as read_f,open('new_file.txt','w') as write_f:
for line in read_f:
print(line)
write_f.write(line)
五,文件内光标移动
一: read(3):
1. 文件打开方式为文本模式时,代表读取3个字符
2. 文件打开方式为b模式时,代表读取3个字节
二: 其余的文件内光标移动都是以字节为单位如seek,tell,truncate
注意:
1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的
2. truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果
>>> f = open('new_file.txt')
>>> f.tell()
0
>>> f.read(3)
'我觉得'
>>> f.seek(0,0)
0
>>> f.read(10)
'我觉得有点累 我想我'
>>> f.tell()
19
>>> f.seek(0.0)
0.0
>>>
f = open('test.txt','r',encoding='utf-8')
print(f.read(5)) #window编码下默认有\r\n两个字符
print(f.tell())
f.close()
#以字节方式从开头算,只保留0-15个字节的内容,文件必须写方式打开,除了w和w+
f = open('test.txt','a+',encoding='utf-8')
f.truncate(15)
print(f.read())
#seek默认第二个参数是0,即文件开始位置
f =open('test.txt','r',encoding='utf-8')
print(f.tell())
f.seek(10)
print(f.tell())
f.seek(3)
print(f.tell()) #认为是13是错误的,但还是默认从开始位置移动指针位置
#1,2,一般用b方式打开文件
#1,即相对于上一次指针移动的位置
f =open('test.txt','rb')
print(f.tell())
f.seek(10,1)
print(f.tell())
f.seek(3,1)
print(f.tell()) #现在就是13,相对于前一次位置再向前3个字节
#2,以字节方式尾端开始往前数
f = open('test.txt','rb')
print(f.tell())
f.seek(-5,2) #结束为止开始,所以是负数
print(f.read()) #打印结果:b'\r\n123'
#f.seek(3,1)
#print(f.tell())
#读取大文件最后一行
for i in f.readlines():
#不建议这样做,先将数据读取后全部放在内存里,然后一个一个遍历列表元素
#将文件一行一行的遍历,不需要提前读取全部的
for i in f:
offs = -10
while True:
f.seek(offs,2)
data = f.readlines()
if len(data) > 1:
print('文件最后一行是%s' % (data[-1].decode('utf-8')))
break
offs *= 2
六,文件修改
文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:
方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)
import os
with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
data=read_f.read() #全部读入内存,如果文件很大,会很卡
data=data.replace('alex','SB') #在内存中完成修改
write_f.write(data) #一次性写入新文件
os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件
import os
with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
for line in read_f:
line=line.replace('alex','SB')
write_f.write(line)
os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
作业题:
1. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数,求出本次购物花费的总钱数
apple 10 3
tesla 100000 1
mac 3000 2
lenovo 30000 3
chicken 10 3
with open('a.txt') as f:
li = []
res = 0
for line in f:
li = line.split()
res += eval(li[1])*eval(li[2])
print(res)
2.编写一个程序,接受用户的输入并保存为文件
def file_write(file_name):
f = open(file_name,'w')
print('请输入内容【单独输入\':w\'保存退出】:')
while True:
write_com = input('保存退出:')
if write_com != ':w':
f.write(f.read())
else:
break
f.close()
file_name = input('请输入文件名:')
file_write(file_name)
3.编写一个程序,比较用户输入的两个文件,如果不同,显示出所有不同的行号与第一个不同字符的位置
def file_differ(file_name1,file_name2):
f1 = open(file_name1)
f2 = open(file_name2)
count = 0
differ_count = 0
for line1 in f1:
line2 = f2.readline()
count += 1
if line1 != line2:
differ_count += 1
print('第%s行不一样' % count)
return differ_count
f1.close()
f2.close()
file1 = input('请输入需要比较的头文件名:')
file2 = input('请输入需要比较的另一个文件名:')
differ_count = file_differ(file1,file2)
if differ_count != 0:
print('两个文件共有%s出不同' % differ_count)
else:
print('两个文件完全一样')
4.写一个程序,当用户输入文件名和行数(N)后,将该文件的前N行内容打印在屏幕上
def line_print(file_name,line_num):
f = open(file_name)
for line in range(int(line_num):
print(f.readline(),end='')
f.close()
file_name = input('请输入文件名:')
line_num = input('请输入行数:')
line_print(file_name,line_num)
5.对上一题进行扩展,用户可以随意输入行数,例如:10:2打印第10行到21行,输入:21则打印前21行
def line_print(file_name,line_num):
if line_num.strip() == ':':
begin = '1'
end = '-1'
(begin,end) = line_num.split(':')
if begin == '':
begin = '1'
if end == '':
end = '-1'
if begin == '1' and end == '-1':
prompt ='的全文'
elif begin == '1':
prompt ='从开始到%s' % end
elif end == '-1':
promt = '从%s到结束' % begin
else:
prompt = '从第%s行开始到%s行' % (begin,end)
print('\n文件%s%s的内容如下:' %(filename,prompt))
begin = int(begin) -1
end = int(end)
lines = end - begin
f = open(file_name)
for i in range(begin):
f.readline()
if lines < 0:
print(f.read())
else:
for x in range(lines):
print(f.readline(),end='')
f.close()
file_name = input('请输入文件名:')
line_num = input('请输入行数:')
line_print(file_name,line_num)
6.编写一个程序,实现'全部替换'功能\
def file_replace(filename,rep_word,new_word):
f1 = open(file_name)
count = 0
content = []
for line in f1:
if rep_word in line:
count += line.count(rep_word)
line = line.replace(rep_word,new_word)
content.append(line)
choice = input('\n文件%s中共有%s个%s,您确定要把素有的%s替换成%s吗-->>【Yes/No】:' %
(filename,count,rep_word,rep_word,new_word))
if choice in ['Yes','YES','yes']:
f2 = open(file_name,'w')
f2.writelines(content)
f2.close()
f1.close()
file_name = input('请输入文件名:')
rep_word = input('请输入需要替换的字符:')
new_word = input('请输入新的字符:')
file_replace(file_name,rep_word,new_word)