python基础学习_Python基础学习——编码与读写

编码与读写

编码,即将人类语言转换为计算机语言,就是【编码】encode();反之,就是【解码】decode()。它们的用法如下图所表示:

58730f5fe9bfc98ebd9098c16b4a6641.png

将人类语言编码后得到的结果,有一个相同之处,就是最前面都有一个字母b,比如b'xcexe2xb7xe3',这代表它是bytes(字节)类型的数据

所谓的编码,其实本质就是把str(字符串)类型的数据,利用不同的编码表,转换成bytes(字节)类型的数据

用decode()解码的时候则要注意,UTF-8编码的字节就一定要用UTF-8的规则解码,其他编码同理,否则就会出现乱码或者报错的情况,现在请你将下列字节解码成UTF-8的形式,打印出来。

例:

print(b'xe6x88x91xe7x88xb1xe4xbdxa0'.decode('utf-8'))

输出:

我爱你

编码知识虽然看起来很琐碎,但它又是非常重要的,如果不能理解这些背景知识,指不定你哪天就会遇到坑,就像隐藏在丛林中的蛇,时不时地咬你一口

读和写文件

文件读写,是Python代码调用电脑文件的主要功能,能被用于读取和写入文本记录、音频片段、Excel文档、保存邮件以及任何保存在电脑上的东西。

你可能会疑惑:为什么要在Python打开文件?我直接打开那个文件,在那个文件上操作不就好了吗?

一般来说直接打开操作当然是没问题的。但假如你有一项工作,需要把100个Word文档里的资料合并到1个文件上,一个个地复制粘贴多麻烦啊,这时你就能用上Python了。或者,当你要从网上下载几千条数据时,直接用Python帮你把数据一次性存入文件也是相当方便。

要不然怎么说,Python把我们从重复性工作中解放出来呢~

【文件读写】,是分为【读】和【写】两部分的,我们就先来瞧瞧【读文件】是怎么实现的?

读取文件其实,真的就三步:

5e801a2fa20afb4375ebf106ad3ff1b4.png

是不是像很久之前的那个冷笑话?"请问把大象放进冰箱需要几步?"三步:打开冰箱,放入大象,关闭冰箱。同样地,读文件也是三步:开——读——关。

在Python中想要操作文件需要先创建或者打开指定文件并创建文件对象,可以通过内置函数open()实现。

open() 将会返回一个 file 对象,基本语法格式如下:

file = open(filename[, mode[,buffering]])

# file : 被创建的文件对象。

# filename:包含了你要访问的文件名称的字符串值。

# mode:决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。

# buffering:可选参数,用于指定读写文件的缓冲模式,值为0表达式不缓存,值为1表示缓存。如果大于1,则表示缓冲区的大小,默认为缓存模式。

下图很好的总结了这几种模式:

77322b556f09bf2f026b795c484d13cc.png

以下实例将字符串写入到文件 foo.txt 中:

实例

# 打开一个文件

f = open("/tmp/foo.txt", "w")

f.write( "Python 是一个非常好的语言。是的,的确非常好!!" )

# 关闭打开的文件

f.close()

第一个参数为要打开的文件名。

第二个参数描述文件如何使用的字符。 mode 可以是 'r' 如果文件只读, 'w' 只用于写 (如果存在同名文件则将被删除), 和 'a' 用于追加文件内容; 所写的任何数据都会被自动增加到末尾. 'r+' 同时用于读写。 mode 参数是可选的; 'r' 将是默认值。

此时打开文件 foo.txt,显示如下:

$ cat /tmp/foo.txt

Python 是一个非常好的语言。

是的,的确非常好!!

如果打开的文件不存在时,可以先创建文件,也可以在调用open()函数时,指定mode的参数值为w,w+,a,a+。这样,当要打开的文件不存在时,就可以创建新文件。

使用open()函数不仅可以以文本的形式打开文件,并且还可以以二进制形式打开非文本文件,如图片,音频,视频等等等等。

例:比如你有一张图片a.png

file = open('a.png','rb')

print(file)

【第1步-开】使用open()函数打开文件。语法是这样的:

file = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

file这个变量是存放读取的文件数据的,以便对文件进行下一步的操作。

open()函数里面有三个参数,对吧:

'/Users/Ted/Desktop/test/abc.txt'

'r'

encoding='utf-8'

我们一个个来看。第一个参数是文件的保存地址,一定要写清楚,否则计算机找不到

文件的地址有两种:相对路径和绝对路径,拖到终端获取的地址是绝对路径。这两种地址,Mac和Windows电脑还有点傲娇地不太一样,下面我就帮大家捋一捋。

绝对路径就是最完整的路径,相对路径指的就是【相对于当前文件夹】的路径

Windows系统里,常用来表示绝对路径,/来表示相对路径,所以当你把文件拖入终端的时候,绝对路径就变成:

C:甥敳獲TedDesktopestabc.txt

但是呢,别忘了在Python中是转义字符,所以时常会有冲突。为了避坑,Windows的绝对路径通常要稍作处理,写成以下两种格式;

open('C:甥敳獲TedDesktopestabc.txt')

#将''替换成''

open(r'C:甥敳獲TedDesktopestabc.txt')

#在路径前加上字母r

【第2步-读】

打开文件之后,就可以用read()函数进行读取的操作了

例:

file1 = open('/Users/Ted/Desktop/test/abc.txt', 'r',encoding='utf-8')

filecontent = file1.read()

第1行代码是我们之前写的。是以读取的方式打开了文件"abc.txt"。

第2行代码就是在读取file1的内容,写法是变量file1后面加个.句点,再加个read(),并且把读到的内容放在变量filecontent里面,这样我们才能拿到文件的内容。

那么,现在我们想要看看读到了什么数据,可以用print()函数看看。

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

filecontent = file1.read()

print(filecontent)

【第3步-关】关闭文件,使用的是close()函数。

file1 = open('/Users/Ted/Desktop/test/abc.txt','r',encoding='utf-8')

filecontent = file1.read()

print(filecontent)

file1.close()

为啥要关闭文件呢?原因有两个:1.计算机能够打开的文件数量是有限制的,open()过多而不close()的话,就不能再打开文件了。2.能保证写入的内容已经在文件里被保存好了。

文件关闭之后就不能再对这个文件进行读写了。如果还需要读写这个文件的话,就要再次 open() 打开这个文件。

文件读写的总结图。

8fc5403ca1b09bd2bffbcfc58a7b8dc7.png
bd28955ab64d919ad8bd569871f6d9bd.png

文件对象的方法

f.read()

为了读取一个文件的内容,调用 f.read(size), 这将读取一定数目的数据, 然后作为字符串或字节对象返回。

size 是一个可选的数字类型的参数。 当 size 被忽略了或者为负, 那么该文件的所有内容都将被读取并且返回。

以下实例假定文件 foo.txt 已存在(上面实例中已创建):

实例

# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.read()print(str)# 关闭打开的文件f.close()

执行以上程序,输出结果为:

Python 是一个非常好的语言。是的,的确非常好!!

f.readline()

f.readline() 会从文件中读取单独的一行。换行符为 ''。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。

实例

# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.readline()print(str)# 关闭打开的文件f.close()

执行以上程序,输出结果为:

Python 是一个非常好的语言。

f.readlines()

f.readlines() 将返回该文件中包含的所有行。

如果设置可选参数 sizehint, 则读取指定长度的字节, 并且将这些字节按行分割。

实例

# 打开一个文件f = open("/tmp/foo.txt", "r")str = f.readlines()print(str)# 关闭打开的文件f.close()

执行以上程序,输出结果为:

['Python 是一个非常好的语言。', '是的,的确非常好!!']

另一种方式是迭代一个文件对象然后读取每行:

实例

# 打开一个文件f = open("/tmp/foo.txt", "r")for line in f: print(line, end='')# 关闭打开的文件f.close()

执行以上程序,输出结果为:

Python 是一个非常好的语言。是的,的确非常好!!

这个方法很简单, 但是并没有提供一个很好的控制。 因为两者的处理机制不同, 最好不要混用。

f.write()

f.write(string) 将 string 写入到文件中, 然后返回写入的字符数。

实例

# 打开一个文件f = open("/tmp/foo.txt", "w")num = f.write( "Python 是一个非常好的语言。是的,的确非常好!!" )print(num)# 关闭打开的文件f.close()

执行以上程序,输出结果为:

29

如果要写入一些不是字符串的东西, 那么将需要先进行转换:

实例

# 打开一个文件f = open("/tmp/foo1.txt", "w")value = ('www.runoob.com', 14)s = str(value)f.write(s)# 关闭打开的文件f.close()

执行以上程序,打开 foo1.txt 文件:

$ cat /tmp/foo1.txt ('www.runoob.com', 14)

f.tell()

f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。

f.seek()

如果要改变文件当前的位置, 可以使用 f.seek(offset, from_what) 函数。

from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:

seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符

seek(x,1) : 表示从当前位置往后移动x个字符

seek(-x,2):表示从文件的结尾往前移动x个字符

from_what 值为默认为0,即文件开头。下面给出一个完整的例子:

>>> f = open('/tmp/foo.txt', 'rb+')>>> f.write(b'0123456789abcdef')16>>> f.seek(5) # 移动到文件的第六个字节5>>> f.read(1)b'5'>>> f.seek(-3, 2) # 移动到文件的倒数第三字节13>>> f.read(1)b'd'

f.close()

在文本文件中 (那些打开文件的模式下没有 b 的), 只会相对于文件起始位置进行定位。

当你处理完一个文件后, 调用 f.close() 来关闭文件并释放系统的资源,如果尝试再调用该文件,则会抛出异常。

>>> f.close()>>> f.read()Traceback (most recent call last): File "", line 1, in ?ValueError: I/O operation on closed file

当处理一个文件对象时, 使用 with 关键字是非常好的方式。在结束后, 它会帮你正确的关闭文件。 而且写起来也比 try - finally 语句块要简短:

>>> with open('/tmp/foo.txt', 'r') as f:... read_data = f.read()>>> f.closedTrue

文件对象还有其他方法, 如 isatty() 和 trucate(), 但这些通常比较少用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值