【python学习笔记】文件操作_1 编写程序,创建一个名为 ch7.txt 的文件,要求编码格式为utf8,把下面两个列表-CSDN博客

本文链接：https://blog.csdn.net/Mr_HUMI/article/details/80959814

一,介绍

1.我们用python或其他语言编写的应用程序若想要把数据永久保存下来，必须要保存于硬盘中，这就涉及到应用程序要操作硬件，
众所周知，应用程序是无法直接操作硬件的，这就用到了操作系统。操作系统把复杂的硬件操作封装成简单的接口给用户/应用
程序使用，其中文件就是操作系统提供给应用程序来操作硬盘虚拟概念，用户或应用程序通过操作文件，可以将自己的数据永久
保存下来。
2.另外，在我们编写代码的时候，操作系统为了更快地做出响应，把当前的数据都放在内存中，因为内存和CPU的传输速度比硬

盘和CPU之间的传输速度快很多，但是一旦断电就没戏了,所以时刻记得保存文件。

3.有了文件的概念，我们无需再去考虑操作硬盘的细节，只需要关注操作文件的流程：
    #1. 打开文件，得到文件对象
    #2. 对文件对象进行操作
    #3. 关闭文件

二,打开文件及读取文件

语法：open(file,mode='r',buffering=-1,encoding=None,errors=None,newline=None,closefd=True,opener=None)
目前只关注前三个参数
1.第一个是传入文件名，若只有文件名，不带路径的话，那么python会在当前目录中去找到该文件并打开

2.第二个是指定文件打开模式
3.第三个是编码格式

#1. 利用open()打开文件，得到文件对象并赋值给一个变量
f=open('a.txt','r',encoding='utf-8') #默认打开模式就为r

#2. 对文件对象进行操作，例如读取
data=f.read()

#3. 关闭文件
f.close()

需要注意两各地方：

1.在操作完毕文件后，一定要记住f.close()，否则就会导致操作系统打开的文件还没有关闭，白白占用资源

2.python的默认编码格式为UTF-8

三,文件打开模式

#1. 打开文件的模式有(默认为文本模式)：
r ，只读模式【默认模式，文件必须存在，不存在则抛出异常】
w，只写模式【不可读；不存在则创建；存在则清空内容】

a，追加写模式【不可读；不存在则创建；存在则只追加内容】
x，只写模式【不可读；不存在则创建，存在则报错】

#2. 对于非文本文件，我们只能使用b模式，"b"表示以字节的方式操作（而所有文件也都是以字节的形式存储的，使用这种模式无需考虑文本文件的字符编码、图片文件的jgp格式、视频文件的avi格式）
rb
wb
ab
注：以b方式打开时，读取到的内容是字节类型，写入时也需要提供字节类型，不能指定编码

#3. 了解部分
"+" 表示可以同时读写某个文件
r+，读写【可读，可写】
w+，写读【可读，可写】
a+，写读【可读，可写】
x+ ，写读【可读，可写】

四,文件对象方法

#掌握
f.read() #读取所有内容,光标移动到文件末尾
f.readline() #读取一行内容,从光标的位置向后读取，直到遇到\n结束
f.readlines() #读取每一行内容,存放于列表中
当然也可以直接迭代都出来，文件对象本身是支持迭代的直接使用for语句把内容迭代读取出来

f.write('1111\n222\n') #针对文本模式的写,需要自己写换行符
f.write('1111\n222\n'.encode('utf-8')) #针对b模式的写,需要自己写换行符
f.writelines(['333\n','444\n']) #文件模式
f.writelines([bytes('333\n',encoding='utf-8'),'444\n'.encode('utf-8')]) #b模式

#了解
f.readable() #文件是否可读
f.writable() #文件是否可读
f.closed #文件是否关闭
f.encoding #如果文件打开模式为b,则没有该属性
f.flush() #立刻将文件内容从内存刷到硬盘

f.name

写入文件：

在写入前，请确认文件打开模式有'w'或'a'，否则会出错：

>>> f = open("record.txt")
>>> f.write("这是一段写入的数据")
Traceback (most recent call last):
  File "<pyshell#23>", line 1, in <module>
    f.write("这是一段写入的数据")
io.UnsupportedOperation: not writable
>>>

以'w'模式打开

>>> f = open("record.txt","w")
>>> f.write("这是一段待写入的数据")
10
>>> f.close()
>>> 
注意：'w'模式写入文件会把之前文件内容全部删除，如果要在之前的内容追加，可以使用'a'模式打开文件

#b的读取方式不能使用编码方式
#f = open('test.txt','rb',encoding='utf-8')  #报错

f = open('test.txt','rb')
data = f.read()
print(data)  #打印:b'hello1\r\n222222\r\n33333\r\n4444'

#'字符串'--encode-->>bytes二进制
#bytes --decode-->>'字符串'
f = open('test.txt','rb')
data = f.read()
print(data.decode('utf-8'))  #打印:b'hello1\r\n222222\r\n33333\r\n4444'
f.close()

f = open('test.txt','wb')
f.write('1111\n')
f.close() #报错：TypeError: a bytes-like object is required, not 'str'

f = open('test.txt','wb')
f.write(bytes('1111\n',encoding='utf-8'))
#字符串转换成二进制形式：
#x ='hello'
#b = bytes(x,encoding='utf-8') #转化为二进制形式，必须先编码
f.write('美女'.encode('utf-8'))
#直接使用encode编码为二进制
f.close()

f =open('test.txt','ab')
f.write('帅哥'.encode('utf-8'))
f.close()

#若忘记关闭文件，可以使用with来打开文件，操作完后，默认关闭文件

with open('old_file.txt','r') as read_f,open('new_file.txt','w') as write_f:
    for line in read_f:
    	print(line)
    	write_f.write(line)

五,文件内光标移动

一: read(3)：
　　1. 文件打开方式为文本模式时，代表读取3个字符
　　2. 文件打开方式为b模式时，代表读取3个字节
二: 其余的文件内光标移动都是以字节为单位如seek，tell，truncate
注意：
　　1. seek有三种移动方式0，1，2，其中1和2必须在b模式下进行，但无论哪种模式，都是以bytes为单位移动的
　　2. truncate是截断文件，所以文件的打开方式必须可写，但是不能用w或w+等方式打开，因为那样直接清空文件了，所以truncate要在r+或a或a+等模式下测试效果

>>> f = open('new_file.txt')
>>> f.tell()
0
>>> f.read(3)
'我觉得'
>>> f.seek(0,0)
0
>>> f.read(10)
'我觉得有点累 我想我'
>>> f.tell()
19
>>> f.seek(0.0)
0.0
>>>

f = open('test.txt','r',encoding='utf-8')
print(f.read(5))    #window编码下默认有\r\n两个字符
print(f.tell())
f.close()

#以字节方式从开头算，只保留0-15个字节的内容，文件必须写方式打开，除了w和w+
f = open('test.txt','a+',encoding='utf-8')
f.truncate(15)
print(f.read())

#seek默认第二个参数是0，即文件开始位置
f =open('test.txt','r',encoding='utf-8')
print(f.tell())
f.seek(10)
print(f.tell())
f.seek(3)
print(f.tell()) #认为是13是错误的，但还是默认从开始位置移动指针位置

#1,2，一般用b方式打开文件

#1，即相对于上一次指针移动的位置
f =open('test.txt','rb')
print(f.tell())
f.seek(10,1)
print(f.tell())
f.seek(3,1)
print(f.tell()) #现在就是13，相对于前一次位置再向前3个字节

#2，以字节方式尾端开始往前数
f = open('test.txt','rb')
print(f.tell())
f.seek(-5,2) #结束为止开始，所以是负数
print(f.read())   #打印结果：b'\r\n123'
#f.seek(3,1)
#print(f.tell())

#读取大文件最后一行
for i in f.readlines():
	#不建议这样做，先将数据读取后全部放在内存里，然后一个一个遍历列表元素

#将文件一行一行的遍历，不需要提前读取全部的
for i in f: 
    offs = -10
    while True:
	f.seek(offs,2)
	data = f.readlines()
	if len(data) > 1:
	    print('文件最后一行是%s' % (data[-1].decode('utf-8')))
	    break
	offs *= 2

六,文件修改

文件的数据是存放于硬盘上的，因而只存在覆盖、不存在修改这么一说，我们平时看到的修改文件，都是模拟出来的效果，具体的说有两种实现方式：

方式一：将硬盘存放的该文件的内容全部加载到内存，在内存中是可以修改的，修改完毕后，再由内存覆盖到硬盘（word，vim，nodpad++等编辑器）

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    data=read_f.read() #全部读入内存,如果文件很大,会很卡
    data=data.replace('alex','SB') #在内存中完成修改

    write_f.write(data) #一次性写入新文件

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')

方式二：将硬盘存放的该文件的内容一行一行地读入内存，修改完毕就写入新文件，最后用新文件覆盖源文件

import os

with open('a.txt') as read_f,open('.a.txt.swap','w') as write_f:
    for line in read_f:
        line=line.replace('alex','SB')
        write_f.write(line)

os.remove('a.txt')
os.rename('.a.txt.swap','a.txt')

作业题：

1. 文件a.txt内容：每一行内容分别为商品名字，价钱，个数，求出本次购物花费的总钱数
    apple 10 3
    tesla 100000 1
    mac 3000 2
    lenovo 30000 3

chicken 10 3

with open('a.txt') as f:
    li = []
    res = 0
    for line in f:
        li = line.split()
	res += eval(li[1])*eval(li[2])
    print(res)

2.编写一个程序，接受用户的输入并保存为文件

def file_write(file_name):
    f = open(file_name,'w')
    print('请输入内容【单独输入\':w\'保存退出】:')
    while True:
        write_com = input('保存退出:')
	if write_com != ':w':
	    f.write(f.read())
	else:
	    break
    f.close()

file_name = input('请输入文件名:')
file_write(file_name)

3.编写一个程序，比较用户输入的两个文件，如果不同，显示出所有不同的行号与第一个不同字符的位置

def file_differ(file_name1,file_name2):
    f1 = open(file_name1)
    f2 = open(file_name2)
    count = 0
    differ_count = 0

    for line1 in f1:
	line2 = f2.readline()
	count += 1
	if line1 != line2:
	    differ_count += 1
	    print('第%s行不一样' % count)

    return differ_count

    f1.close()
    f2.close()

file1 = input('请输入需要比较的头文件名:')
file2 = input('请输入需要比较的另一个文件名:')
differ_count = file_differ(file1,file2)
if differ_count != 0:
    print('两个文件共有%s出不同' % differ_count)
else:
    print('两个文件完全一样')

4.写一个程序，当用户输入文件名和行数(N)后，将该文件的前N行内容打印在屏幕上

def line_print(file_name,line_num):
    f = open(file_name)
    for line in range(int(line_num):
        print(f.readline(),end='')
    f.close()

file_name = input('请输入文件名:')
line_num = input('请输入行数:')

line_print(file_name,line_num)

5.对上一题进行扩展，用户可以随意输入行数，例如：10：2打印第10行到21行，输入：21则打印前21行

def line_print(file_name,line_num):
    if line_num.strip() == ':':
        begin = '1'
	end = '-1'

    (begin,end) = line_num.split(':')

    if begin == '':
	begin = '1'
    if end == '':
        end = '-1'

    if begin == '1' and end == '-1':
	prompt ='的全文'
    elif begin == '1':
	prompt ='从开始到%s' % end
    elif end == '-1':
	promt = '从%s到结束' % begin
    else:
	prompt = '从第%s行开始到%s行' % (begin,end)

    print('\n文件%s%s的内容如下:' %(filename,prompt))

    begin = int(begin) -1
    end = int(end)
    lines = end - begin

    f = open(file_name)

    for i in range(begin):
	f.readline()

    if lines < 0:
	print(f.read())
    else:
	for x in range(lines):
	    print(f.readline(),end='')
    f.close()

file_name = input('请输入文件名:')
line_num = input('请输入行数:')
line_print(file_name,line_num)

6.编写一个程序，实现'全部替换'功能\

def file_replace(filename,rep_word,new_word):
    f1 = open(file_name)
    count = 0
    content = []

    for line in f1:
	if rep_word in line:
	    count += line.count(rep_word)
	    line = line.replace(rep_word,new_word)
        content.append(line)

    choice = input('\n文件%s中共有%s个%s,您确定要把素有的%s替换成%s吗-->>【Yes/No】:' % 
		    (filename,count,rep_word,rep_word,new_word))

    if choice in ['Yes','YES','yes']:
	f2 = open(file_name,'w')
	f2.writelines(content)
	f2.close()

    f1.close()

file_name = input('请输入文件名:')
rep_word = input('请输入需要替换的字符:')
new_word = input('请输入新的字符:')
file_replace(file_name,rep_word,new_word)