编码与读写
编码,即将人类语言转换为计算机语言,就是【编码】encode();反之,就是【解码】decode()。它们的用法如下图所表示:
将人类语言编码后得到的结果,有一个相同之处,就是最前面都有一个字母b,比如b'\\xce\\xe2\\xb7\\xe3',这代表它是bytes(字节)类型的数据
所谓的编码,其实本质就是把str(字符串)类型的数据,利用不同的编码表,转换成bytes(字节)类型的数据
用decode()解码的时候则要注意,UTF-8编码的字节就一定要用UTF-8的规则解码,其他编码同理,否则就会出现乱码或者报错的情况,现在请你将下列字节解码成UTF-8的形式,打印出来。
例:
print(b'\\xe6\\x88\\x91\\xe7\\x88\\xb1\\xe4\\xbd\\xa0'.decode('utf-8'))
输出:
我爱你
编码知识虽然看起来很琐碎,但它又是非常重要的,如果不能理解这些背景知识,指不定你哪天就会遇到坑,就像隐藏在丛林中的蛇,时不时地咬你一口
读和写文件
文件读写,是Python代码调用电脑文件的主要功能,能被用于读取和写入文本记录、音频片段、Excel文档、保存邮件以及任何保存在电脑上的东西。
你可能会疑惑:为什么要在Python打开文件?我直接打开那个文件,在那个文件上操作不就好了吗?
一般来说直接打开操作当然是没问题的。但假如你有一项工作,需要把100个Word文档里的资料合并到1个文件上,一个个地复制粘贴多麻烦啊,这时你就能用上Python了。或者,当你要从网上下载几千条数据时,直接用Python帮你把数据一次性存入文件也是相当方便。
要不然怎么说,Python把我们从重复性工作中解放出来呢~
【文件读写】,是分为【读】和【写】两部分的,我们就先来瞧瞧【读文件】是怎么实现的?
读取文件其实,真的就三步:
是不是像很久之前的那个冷笑话?"请问把大象放进冰箱需要几步?"三步:打开冰箱,放入大象,关闭冰箱。同样地,读文件也是三步:开——读——关。
在Python中想要操作文件需要先创建或者打开指定文件并创建文件对象,可以通过内置函数open()实现。
open() 将会返回一个 file 对象,基本语法格式如下:
file = open(filename[, mode[,buffering]])
# file : 被创建的文件对象。
# filename:包含了你要访问的文件名称的字符串值。
# mode:决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。
# buffering:可选参数,用于指定读写文件的缓冲模式,值为0表达式不缓存,值为1表示缓存。如果大于1,则表示缓冲区的大小,默认为缓存模式。
下图很好的总结了这几种模式:
以下实例将字符串写入到文件 foo.txt 中:
实例
# 打开一个文件
f = open("/tmp/foo.txt", "w")
f.write( "Python 是一个非常好的语言。
\n
是的,的确非常好!!
\n
" )
# 关闭打开的文件
f.close()
第一个参数为要打开的文件名。
第二个参数描述文件如何使用的字符。 mode 可以是 'r' 如果文件只读, 'w' 只用于写 (如果存在同名文件则将被删除), 和 'a' 用于追加文件内容; 所写的任何数据都会被自动增加到末尾. 'r+' 同时用于读写。 mode 参数是可选的; 'r' 将是默认值。
此时打开文件 foo.txt,显示如下:
$ cat /tmp/foo.txt
Python 是一个非常好的语言。
是的,的确非常好!!
如果打开的文件不存在时,可以先创建文件,也可以在调用open()函数时,指定mode的参数值为w,w+,a,a+。这样,当要打开的文件不存在时,就可以创建新文件。
使用open()函数不仅可以以文本的形式打开文件,并且还可以以二进制形式打开非文本文件,如图片,音频,视频等等等等。
例:比如你有一张图片a.png
file = open('a.png','rb')
print(file)
【第1步-开】使用open()函数打开文件。语法是这样的:
file = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')
file这个变量是存放读取的文件数据的,以便对文件进行下一步的操作。
open()函数里面有三个参数,对吧:
'/Users/Ted/Desktop/test/abc.txt'
'r'
encoding='utf-8'
我们一个个来看。第一个参数是文件的保存地址,一定要写清楚,否则计算机找不到
文件的地址有两种:相对路径和绝对路径,拖到终端获取的地址是绝对路径。这两种地址,Mac和Windows电脑还有点傲娇地不太一样,下面我就帮大家捋一捋。
绝对路径就是最完整的路径,相对路径指的就是【相对于当前文件夹】的路径
Windows系统里,常用\来表示绝对路径,/来表示相对路径,所以当你把文件拖入终端的时候,绝对路径就变成:
C:\Users\Ted\Desktop\test\abc.txt
但是呢,别忘了\在Python中是转义字符,所以时常会有冲突。为了避坑,Windows的绝对路径通常要稍作处理,写成以下两种格式;
open('C:\\Users\\Ted\\Desktop\\test\\abc.txt')
#将'\'替换成'\\'
open(r'C:\Users\Ted\Desktop\test\abc.txt')
#在路径前加上字母r
【第2步-读】
打开文件之后,就可以用read()函数进行读取的操作了
例:
file1 = open('/Users/Ted/Desktop/test/abc.txt', 'r',encoding='utf-8')
filecontent = file1.read()
第1行代码是我们之前写的。是以读取的方式打开了文件"abc.txt"。
第2行代码就是在读取file1的内容,写法是变量file1后面加个.句点,再加个read(),并且把读到的内容放在变量filecontent里面,这样我们才能拿到文件的内容。
那么,现在我们想要看看读到了什么数据,可以用print()函数看看。
file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')
filecontent = file1.read()
print(filecontent)
【第3步-关】关闭文件,使用的是close()函数。
file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')
filecontent = file1.read()
print(filecontent)
file1.close()
为啥要关闭文件呢?原因有两个:1.计算机能够打开的文件数量是有限制的,open()过多而不close()的话,就不能再打开文件了。2.能保证写入的内容已经在文件里被保存好了。
文件关闭之后就不能再对这个文件进行读写了。如果还需要读写这个文件的话,就要再次 open() 打开这个文件。
文件读写的总结图。
文件对象的方法
f.read()
为了读取一个文件的内容,调用 f.read(size), 这将读取一定数目的数据, 然后作为字符串或字节对象返回。
size 是一个可选的数字类型的参数。 当 size 被忽略了或者为负, 那么该文件的所有内容都将被读取并且返回。
以下实例假定文件 foo.txt 已存在(上面实例中已创建):
实例
# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.read()
(str)# 关闭打开的文件f.close()
执行以上程序,输出结果为:
Python 是一个非常好的语言。是的,的确非常好!!
f.readline()
f.readline() 会从文件中读取单独的一行。换行符为 '\n'。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。
实例
# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.readline()
(str)# 关闭打开的文件f.close()
执行以上程序,输出结果为:
Python 是一个非常好的语言。
f.readlines()
f.readlines() 将返回该文件中包含的所有行。
如果设置可选参数 sizehint, 则读取指定长度的字节, 并且将这些字节按行分割。
实例
# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.readlines()
(str)# 关闭打开的文件f.close()
执行以上程序,输出结果为:
['Python 是一个非常好的语言。\n', '是的,的确非常好!!\n']
另一种方式是迭代一个文件对象然后读取每行:
实例
# 打开一个文件f = open("/tmp/foo.txt", "r")
for
line
in
f:
(line, end='')# 关闭打开的文件f.close()
执行以上程序,输出结果为:
Python 是一个非常好的语言。是的,的确非常好!!
这个方法很简单, 但是并没有提供一个很好的控制。 因为两者的处理机制不同, 最好不要混用。
f.write()
f.write(string) 将 string 写入到文件中, 然后返回写入的字符数。
实例
# 打开一个文件f = open("/tmp/foo.txt", "w")num = f.write( "Python 是一个非常好的语言。
\n
是的,的确非常好!!
\n
" )
(num)# 关闭打开的文件f.close()
执行以上程序,输出结果为:
29
如果要写入一些不是字符串的东西, 那么将需要先进行转换:
实例
# 打开一个文件f = open("/tmp/foo1.txt", "w")value = ('www.runoob.com', 14)s = str(value)f.write(s)# 关闭打开的文件f.close()
执行以上程序,打开 foo1.txt 文件:
$ cat /tmp/foo1.txt ('www.runoob.com', 14)
f.tell()
f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。
f.seek()
如果要改变文件当前的位置, 可以使用 f.seek(offset, from_what) 函数。
from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:
seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
seek(x,1) : 表示从当前位置往后移动x个字符
seek(-x,2):表示从文件的结尾往前移动x个字符
from_what 值为默认为0,即文件开头。下面给出一个完整的例子:
>>> f = open('/tmp/foo.txt', 'rb+')>>> f.write(b'0123456789abcdef')16>>> f.seek(5) # 移动到文件的第六个字节5>>> f.read(1)b'5'>>> f.seek(-3, 2) # 移动到文件的倒数第三字节13>>> f.read(1)b'd'
f.close()
在文本文件中 (那些打开文件的模式下没有 b 的), 只会相对于文件起始位置进行定位。
当你处理完一个文件后, 调用 f.close() 来关闭文件并释放系统的资源,如果尝试再调用该文件,则会抛出异常。
>>> f.close()>>> f.read()Traceback (most recent call last): File "", line 1,
in
?ValueError: I/O operation on closed file
当处理一个文件对象时, 使用 with 关键字是非常好的方式。在结束后, 它会帮你正确的关闭文件。 而且写起来也比 try - finally 语句块要简短:
>>>
with
open('/tmp/foo.txt', 'r')
as
f:... read_data = f.read()>>> f.closedTrue
文件对象还有其他方法, 如 isatty() 和 trucate(), 但这些通常比较少用。