文件编码
编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译回可识别内容。
计算机中有许多可用编码:
- UTF-8
- GBK
- Big5
- 等
不同的编码,将内容翻译成二进制也是不同的。
编码有许多,所以要使用正确的编码,才能对文件进行正确的读写操作呢。
查看文件编码
我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么。
UTF-8是目前全球通用的编码格式,除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可。
文件的读取
一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。
在日常生活中,文件操作主要包括打开、关闭、读、写等操作。
文件的操作步骤
1.打开文件
2.读写文件
3.关闭文件
注意:
可以只打开和关闭文件,不进行任何读写
open()打开函数
在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下
open (name, mode, encoding)
name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)。
mode:设置打开文件的模式(访问模式):只读、写入、追加等。
encoding:编码格式(推荐使用UTF-8)
示例代码:
f= open('python.txt','r', encoding="UTF-8")
# encoding的顺序不是第三位,所以不能用位置参数,用关键字参数直接指定
(encoding在第四位,它前面还有buffering=-1)
注意:此时的f是open函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问
mode常用的三种基础访问模式
模式1:
r
以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
模式2:
w
打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,原有内容会被删除。如果该文件不存在,创建新文件。
模式3:
a
打开一个文件用于追加。如果该文件已存在,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
读操作相关方法
1.read()方法:
文件对象.read(num)
num表示要从文件中读取的数据的长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据。
2.readlines()方法:
文件对象.readlines()
readlines可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
3.readline()方法:一次读取一行内容
文件对象.readline()
4.for循环读取文件行
for line in open("python.txt","r"):
print(line)
#每一个line临时变量,就记录了文件的一行数据
5.close() 关闭文件对象
f=open("python.txt","r")
f.close()
#最后通过close,关闭文件对象,也就是关闭对文件的占用
#如果不调用close,同时程序没有停止运行,那么这个文件将一直被Python程序占用。
6.with open 语法
with open("python.txt","r") as f:
f.readlines()
#通过在with open的语句块中对文件进行操作
#可以在操作完成后自动关闭close文件,避免遗忘掉close方法
文件的写入
写操作快速入门
写入文件使用open函数的”w”模式进行写入
案例演示:
#1.打开文件
f=open('python.txt','w')
#2.文件写入
f.write('hello world")
#3.内容刷新
f.flush()
注意:
1.直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
2.当调用flush的时候,内容会真正写入文件
3.这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
补充:
1.close()方法内置了flush()方法的功能
2.w模式,文件不存在,会创建新文件
3.w模式,文件存在,会清空原有内容
文件的追加
追加写入操作快速入门
追加写入文件使用open函数的”a”模式进行写入
案例演示:
#1.打开文件,通过a模式打开即可
f=open('python.txt','a')
#2.文件写入
f.write('hello world')
#3.内容刷新
f.flush()
注意:
1.a模式,文件不存在会创建文件
2.a模式,文件存在会在最后,追加写入文件