【python学习笔记】文件操作

一,介绍

1.我们用python或其他语言编写的应用程序若想要把数据永久保存下来,必须要保存于硬盘中,这就涉及到应用程序要操作硬件,
众所周知,应用程序是无法直接操作硬件的,这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用
程序使用,其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念,用户或应用程序通过操作文件,可以将自己的数据永久
保存下来。
2.另外,在我们编写代码的时候,操作系统为了更快地做出响应,把当前的数据都放在内存中,因为内存和CPU的传输速度比硬

盘和CPU之间的传输速度快很多,但是一旦断电就没戏了,所以时刻记得保存文件。

3.有了文件的概念,我们无需再去考虑操作硬盘的细节,只需要关注操作文件的流程:
    #1. 打开文件,得到文件对象
    #2. 对文件对象进行操作
    #3. 关闭文件

二,打开文件及读取文件

语法:open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
目前只关注前三个参数
1.第一个是传入文件名,若只有文件名,不带路径的话,那么python会在当前目录中去找到该文件并打开

2.第二个是指定文件打开模式
3.第三个是编码格式

#1. 利用open()打开文件,得到文件对象并赋值给一个变量
f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r

#2. 对文件对象进行操作,例如读取
data=f.read()

#3. 关闭文件
f.close()

需要注意两各地方:

1.在操作完毕文件后,一定要记住f.close(),否则就会导致操作系统打开的文件还没有关闭,白白占用资源

2.python的默认编码格式为UTF-8

三,文件打开模式


#1. 打开文件的模式有(默认为文本模式):
r ,只读模式【默认模式,文件必须存在,不存在则抛出异常】
w,只写模式【不可读;不存在则创建;存在则清空内容】

a, 追加写模式【不可读;不存在则创建;存在则只追加内容】
x, 只写模式【不可读;不存在则创建,存在则报错】

#2. 对于非文本文件,我们只能使用b模式,"b"表示以字节的方式操作(而所有文件也都是以字节的形式存储的,使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式)
rb 
wb
ab
注:以b方式打开时,读取到的内容是字节类型,写入时也需要提供字节类型,不能指定编码

#3. 了解部分
"+" 表示可以同时读写某个文件
r+, 读写【可读,可写】
w+,写读【可读,可写】
a+, 写读【可读,可写】
x+ ,写读【可读,可写】

四,文件对象方法


#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,从光标的位置向后读取,直到遇到\n结束
f.readlines() #读取每一行内容,存放于列表中
当然也可以直接迭代都出来,文件对象本身是支持迭代的直接使用for语句把内容迭代读取出来

f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) #文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

#了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘

f.name

写入文件:

在写入前,请确认文件打开模式有'w'或'a',否则会出错:

>>> f = open("record.txt")
>>> f.write("这是一段写入的数据")
Traceback (most recent call last):
  File "<pyshell#23>", line 1, in <module>
    f.write("这是一段写入的数据")
io.UnsupportedOperation: not writable
>>> 

以'w'模式打开

>>> f = open("record.txt","w")
>>> f.write("这是一段待写入的数据")
10
>>> f.close()
>>> 
注意:'w'模式写入文件会把之前文件内容全部删除,如果要在之前的内容追加,可以使用'a'模式打开文件
#b的读取方式不能使用编码方式
#f = open('test.txt','rb',encoding='utf-8')  #报错

f = open('test.txt','rb')
data = f.read()
print(data)  #打印:b'hello1\r\n222222\r\n33333\r\n4444'

#'字符串'--encode-->>bytes二进制
#bytes --decode-->>'字符串'
f = open('test.txt','rb')
data = f.read()
print(data.decode('utf-8'))  #打印:b'hello1\r\n222222\r\n33333\r\n4444'
f.close()

f = open('test.txt','wb')
f.write('1111\n')
f.close() #报错:TypeError: a bytes-like object is required, not 'str'

f = open('test.txt','wb')
f.write(bytes('1111\n',encoding='utf-8'))
#字符串转换成二进制形式:
#x ='hello'
#b = bytes(x,encoding='utf-8') #转化为二进制形式,必须先编码
f.write('美女'.encode('utf-8'))
#直接使用encode编码为二进制
f.close()

f =open('test.txt','ab')
f.write('帅哥'.encode('utf-8'))
f.close()

#若忘记关闭文件,可以使用with来打开文件,操作完后,默认关闭文件

with open('old_file.txt','r') as read_f,open('new_file.txt','w') as write_f:
    for line in read_f:
    	print(line)
    	write_f.write(line)

五,文件内光标移动

一: read(3):
  1. 文件打开方式为文本模式时,代表读取3个字符
  2. 文件打开方式为b模式时,代表读取3个字节
二: 其余的文件内光标移动都是以字节为单位如seek,tell,truncate
注意:
  1. seek有三种移动方式0,1,2,其中1和2必须在b模式下进行,但无论哪种模式,都是以bytes为单位移动的
  2. truncate是截断文件,所以文件的打开方式必须可写,但是不能用w或w+等方式打开,因为那样直接清空文件了,所以truncate要在r+或a或a+等模式下测试效果

>>> f = open('new_file.txt')
>>> f.tell()
0
>>> f.read(3)
'我觉得'
>>> f.seek(0,0)
0
>>> f.read(10)
'我觉得有点累 我想我'
>>> f.tell()
19
>>> f.seek(0.0)
0.0
>>> 
f = open('test.txt','r',encoding='utf-8')
print(f.read(5))    #window编码下默认有\r\n两个字符
print(f.tell())
f.close()

#以字节方式从开头算,只保留0-15个字节的内容,文件必须写方式打开,除了w和w+
f = open('test.txt','a+',encoding='utf-8')
f.truncate(15)
print(f.read())
#seek默认第二个参数是0,即文件开始位置
f =open('test.txt','r',encoding='utf-8')
print(f.tell())
f.seek(10)
print(f.tell())
f.seek(3)
print(f.tell()) #认为是13是错误的,但还是默认从开始位置移动指针位置

#1,2,一般用b方式打开文件

#1,即相对于上一次指针移动的位置
f =open('test.txt','rb')
print(f.tell())
f.seek(10,1)
print(f.tell())
f.seek(3,1)
print(f.tell()) #现在就是13,相对于前一次位置再向前3个字节

#2,以字节方式尾端开始往前数
f = open('test.txt','rb')
print(f.tell())
f.seek(-5,2) #结束为止开始,所以是负数
print(f.read())   #打印结果:b'\r\n123'
#f.seek(3,1)
#print(f.tell())

#读取大文件最后一行
for i in f.readlines():
	#不建议这样做,先将数据读取后全部放在内存里,然后一个一个遍历列表元素

#将文件一行一行的遍历,不需要提前读取全部的
for i in f: 
    offs = -10
    while True:
	f.seek(offs,2)
	data = f.readlines()
	if len(data) > 1:
	    print('文件最后一行是%s' % (data[-1].decode('utf-8')))
	    break
	offs *= 2

六,文件修改

文件的数据是存放于硬盘上的,因而只存在覆盖、不存在修改这么一说,我们平时看到的修改文件,都是模拟出来的效果,具体的说有两种实现方式:

方式一:将硬盘存放的该文件的内容全部加载到内存,在内存中是可以修改的,修改完毕后,再由内存覆盖到硬盘(word,vim,nodpad++等编辑器)

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    data=read_f.read() #全部读入内存,如果文件很大,会很卡
    data=data.replace('alex','SB') #在内存中完成修改

    write_f.write(data) #一次性写入新文件

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')
方式二:将硬盘存放的该文件的内容一行一行地读入内存,修改完毕就写入新文件,最后用新文件覆盖源文件
import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    for line in read_f:
        line=line.replace('alex','SB')
        write_f.write(line)

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')

作业题:

1. 文件a.txt内容:每一行内容分别为商品名字,价钱,个数,求出本次购物花费的总钱数
    apple 10 3
    tesla 100000 1
    mac 3000 2
    lenovo 30000 3

    chicken 10 3

with open('a.txt') as f:
    li = []
    res = 0
    for line in f:
        li = line.split()
	res += eval(li[1])*eval(li[2])
    print(res)

2.编写一个程序,接受用户的输入并保存为文件

def file_write(file_name):
    f = open(file_name,'w')
    print('请输入内容【单独输入\':w\'保存退出】:')
    while True:
        write_com = input('保存退出:')
	if write_com != ':w':
	    f.write(f.read())
	else:
	    break
    f.close()

file_name = input('请输入文件名:')
file_write(file_name)

3.编写一个程序,比较用户输入的两个文件,如果不同,显示出所有不同的行号与第一个不同字符的位置

def file_differ(file_name1,file_name2):
    f1 = open(file_name1)
    f2 = open(file_name2)
    count = 0
    differ_count = 0

    for line1 in f1:
	line2 = f2.readline()
	count += 1
	if line1 != line2:
	    differ_count += 1
	    print('第%s行不一样' % count)

    return differ_count

    f1.close()
    f2.close()

file1 = input('请输入需要比较的头文件名:')
file2 = input('请输入需要比较的另一个文件名:')
differ_count = file_differ(file1,file2)
if differ_count != 0:
    print('两个文件共有%s出不同' % differ_count)
else:
    print('两个文件完全一样')

4.写一个程序,当用户输入文件名和行数(N)后,将该文件的前N行内容打印在屏幕上

def line_print(file_name,line_num):
    f = open(file_name)
    for line in range(int(line_num):
        print(f.readline(),end='')
    f.close()

file_name = input('请输入文件名:')
line_num = input('请输入行数:')

line_print(file_name,line_num)

5.对上一题进行扩展,用户可以随意输入行数,例如:10:2打印第10行到21行,输入:21则打印前21行

def line_print(file_name,line_num):
    if line_num.strip() == ':':
        begin = '1'
	end = '-1'

    (begin,end) = line_num.split(':')

    if begin == '':
	begin = '1'
    if end == '':
        end = '-1'

    if begin == '1' and end == '-1':
	prompt ='的全文'
    elif begin == '1':
	prompt ='从开始到%s' % end
    elif end == '-1':
	promt = '从%s到结束' % begin
    else:
	prompt = '从第%s行开始到%s行' % (begin,end)

    print('\n文件%s%s的内容如下:' %(filename,prompt))

    begin = int(begin) -1
    end = int(end)
    lines = end - begin

    f = open(file_name)

    for i in range(begin):
	f.readline()

    if lines < 0:
	print(f.read())
    else:
	for x in range(lines):
	    print(f.readline(),end='')
    f.close()

file_name = input('请输入文件名:')
line_num = input('请输入行数:')
line_print(file_name,line_num)

6.编写一个程序,实现'全部替换'功能\

def file_replace(filename,rep_word,new_word):
    f1 = open(file_name)
    count = 0
    content = []

    for line in f1:
	if rep_word in line:
	    count += line.count(rep_word)
	    line = line.replace(rep_word,new_word)
        content.append(line)

    choice = input('\n文件%s中共有%s个%s,您确定要把素有的%s替换成%s吗-->>【Yes/No】:' % 
		    (filename,count,rep_word,rep_word,new_word))

    if choice in ['Yes','YES','yes']:
	f2 = open(file_name,'w')
	f2.writelines(content)
	f2.close()

    f1.close()

file_name = input('请输入文件名:')
rep_word = input('请输入需要替换的字符:')
new_word = input('请输入新的字符:')
file_replace(file_name,rep_word,new_word)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值