文件及编码

文件

标签(空格分隔): python文件


读和写文件

file 对象使用 open 函数来创建。
open() 将会返回一个 file 对象,基本语法格式如下:

open(filename, mode)

filename:filename 变量是一个包含了你要访问的文件名称的字符串值。
mode:mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读(r)。

不同模式打开文件的完全列表:

模式描述
r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+打开一个文件用于读写。文件指针将会放在文件的开头。
rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

文件对象的方法

f.write()
f.write(string) 将 string 写入到文件中, 然后返回写入的字符数。

f = open("file_test",'r+',encoding='utf-8') #文件句柄
f.write ("i couldn't make the color match today\n")
print (f.write ("i don't know what else to say"))

f.read()

  • 为了读取一个文件的内容,调用 f.read(size), 这将读取一定数目的数据, 然后作为字符串或字节对象返回。
  • size 是一个可选的数字类型的参数。 当 size 被忽略了或者为负, 那么该文件的所有内容都将被读取并且返回。
f = open("file_test",'r',encoding='utf-8') #文件句柄
data = f.read()
data2 = f.read()
print (data)
print ('---data2---',data2) #思考输出是否和data一致

f.readlines()
f.readlines() 会从文件中读取单独的一行。换行符为 '\n'。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。

f = open("file_test",'r',encoding='utf-8')
for index,line in enumerate(f.readlines()):
    if index == 4:
        print ('---------------')
        continue
    print (line.strip())

上面循环方式会把文件内容全部读到内存当中,

#高效的循环
f = open("file_test",'r',encoding='utf-8')
count = 0
for line in f:
    if count == 4:
        print ('----------')
        count += 1
        contine
    print (line)
    count += 1

f.tell()

f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。

f.seek()

如果要改变文件当前的位置, 可以使用 f.seek(offset, from_what) 函数。
from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾,例如:

  • seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符
  • seek(x,1) : 表示从当前位置往后移动x个字符
  • seek(-x,2):表示从文件的结尾往前移动x个字符

from_what 值为默认为0,即文件开头。下面给出一个完整的例子:

print (f.tell()) 
print (f.readline())
print (f.tell())
f.seek(0)
print (f.readline())

其它函数

print (f.encoding)
print (f.fileno())
print (f.name) #打印文件名
print (f.flush()) #刷新文件内部缓冲,直接把内部缓冲区的数据立刻写入文件, 而不是被动的等待输出缓冲区写入。
print (f.truncate(10)) #截取文件,截取的字节通过size指定,默认为当前文件位置。
#进度条
import sys,time

for i in range(20):
    sys.stdout.write("#")
    sys.stdout.flush()
    time.sleep(0.2)
#文件修改
f = open ("file_test","r",encoding="utf-8")
f_new = open ("file_test.bak","w",encoding="utf-8")

for line in f:
    if "what else to say" in line:
        line = line.replace("what else to say","what else to fuck")
    f_new.write(line)
f.close()
f_new.close()

with语句
为了避免打开文件后忘记关闭,可以通过管理上下文,即:

with open("file_test","r",encoding="utf-8") as f,\
    open ("file_test","r",encoding="utf-8") as f2:
    for line in f:
        print (line)

如此方式,当with代码块执行完毕时,内不会自动关闭并释放文件资源。
在Python2.7后,with又支持同时对多个文件的上下文进行管理。


字符编码与转码

需知:

  • 在python2默认编码是ASCII, python3里默认是unicode
  • unicode 分为 utf-32(占4个字节),utf-16(占两个字节),utf-8(占1-4个字节), 所以utf-16就是现在最常用的unicode版本,不过在文件里存的还是utf-8,因为utf8省空间
  • 在py3中encode,在转码的同时还会把string变成bytes类型,decode在解码的同时还会把bytes变回string
#-*- coding:gbk -*-

s = "你好"
print (s.encode("gbk"))
print (s.encode("utf-8"))
print (s.encode("utf-8").decode("utf-8").encode("gb2312").decode("gb2312"))

转载于:https://www.cnblogs.com/sorui/p/6794359.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值