把第一次写好漏掉的点写在最前面:文件读写的内容都要求是字符串。
几种文件操作的模式:
1. 'r',读模式(默认模式),只能读不能写,文件不存在时报错
2. 'w',写模式,只能写不能读,文件不存在时会创建,但是存在时会先清空原文件内容
3. 'a',追加模式,增加新内容,不存在时会创建,但不能读
4. 'r+',读写模式,能写能读,但文件不存在时会报错
5. 'w+',写读模式,能读能写,文件不存在会创建,但文件存在时会先清空原文件内容
6. 'a+',追加读模式,啥都能(能写,即追加新内容,不存在会创建,能读,不影响原内容)
总之,只要 r 相关的,不存在时都报错,w 相关的,都会清空原文件内容,运用时可根据实际情况选择模式。日常操作就是读写操作配合合适的模式。
一、读
read(): 一次性获取文件内容,返回值为 string
1 f = open('test.txt',encoding='utf-8')2 result = f.read() #获取文件内容,read()方法一次性读取所有内容
3 print(result)4
5 f.close()
readline(): 读取一行
readlines(): 一次性读取,并把文件内容存到 list 中,一行为一个元素
1 f = open('jlf.txt',encoding='utf-8')2 result =f.readlines()3 print(result) #结果:['a\n', 'b\n', 'c\n', 'd\n', 'e\n', 'f'],如果要去掉'\n',则需要用 strip() 方法
4
5 f.close()
二、写
write:直接写内容
writelines:循环把内容写进文件,对象可以是字符串、列表,只要是能循环的都可以。
1 s='sdfasdf'
2 f = open('jlf.txt','w',encoding='utf-8')3
4 #for i in s:
5 #f.write(i)
6 f.writelines(s) #把 list 的内容循环写进文件,与上一个注释掉的方法效果相同
7 f.close()
三、文件指针
是用来指示文件操作的位置。读模式下,指针在最前;写模式下,因为会清空内容,所以也算是在前面;追加模式下,指针在最后。
四、文件中的其他方法(除了上面说过的读和写)
1 f = open('jlf.txt','r+',encoding='utf-8')#encoding参数可以指定文件的编码
2 f.readable()#判断文件是否可读
3 f.writable()#判断文件是否可写
4 f.tell()#获取当前文件的指针指向
5 f.seek(0)#把当前文件指针指向最前面
6 f.fulsh()#写入文件后,立即从内存中把数据写到磁盘中
7 f.truncate()#清空文件内容
8 f.writelines(['1','2'])#将一个列表写入文件中
9 f.close()关闭文件
五、几种高效的操作
1. 不用关闭文件的方式
为防止每次打开文件使用之后忘记关闭,有这样一种方法,可以在你代码运行完之后自动关闭文件,如下
1 with open('jlf.txt',encoding='utf-8') as f1,open('abc.txt','w',encoding='utf-8') as f2:2 content =f1.read()3 f2.write(content)4 print(content)
2. 高效处理文件
在读取文件内容的时候,如果用 read 或者 readlines,都会直接把所有内容读取到内存,文件较大时可能直接导致内存不够用机器卡死,所以这里给出一种比较高效的方式
1 with open('access.log',encoding='utf-8') as f:2 for line in f: #直接循环文件,一次读一行
3 print('每次:',line)
六、修改文件
1. 第一种属于简单直接粗暴的方式,适合小文件的处理,步骤如下
- 先读取内容
- 替换内容
- 清除原有内容
- 写进新内容
例如:
1 f = open('jlf.txt','a+',encoding='utf-8')2 f.seek(0)3 results =f.read()4 content = results.replace('xiaolan','dalan')5 f.seek(0)6 f.truncate() #清空文件内容,或者用w模式再打开一次
7 f.write(content)8 f.close()
(这种的弊端其实写在了上一条,高效处理文件的方法中,这种是把所有内容一次性拿来放在内存,改完之后再重新写回文件)
2. 逐行处理
- 打开 a 文件
- 从 a 读一行,修改,修改后写到 b 文件里
- 删除 a 文件,把 b 重命名为 a
例如:
1 with open('jlf.txt',encoding='utf-8') as f,open('aaaa.txt','w',encoding='utf-8') as f2:2
3 for line inf:4 result =line.upper()5 f2.write(result)6
7 importos8 os.remove('jlf.txt') #对文件的删除和重命名操作需要放在文件关闭之后9 os.rename('aaaa.txt','jlf.txt')
七、最后贴一个练习
监控服务器日志,要求找出每分钟访问超过100次的 ip 地址
1 importtime2 point = 0 #用来标记下面文件读取的位置,方便继续读取
3 while True: #自己再写忘记循环
4 with open('access.log',encoding='utf-8') as f:5 f.seek(point)6 ips ={}7 for line inf:8 if line.strip() != '': #忘记处理空行
9 ip = line.split(‘ ’)[0] #split后的()以一个空格分隔时,可以空着不写(),也可以写入一个空格(' ')
10 if ip inips.keys():11 ips[ip] += 1
12 else:13 ips[ip] = 1
14 point =f.tell()15 for k inips:16 if ips[k] >= 100:17 print('有问题的 ip 是:',k) #自己写时,输出应为 ip,写成了其对应的 key
18 time.sleep(60)
八、json 操作
说白了 json 就是一个字符串。格式其实就是一个字典。有的时候文件读取过程中,文件内存的是json,刚好我们读出来也需要转成字典格式,那就需要有一种方法可以直接识别这种格式,json 模块中刚好就带了这样的方法。
1.写文件
importjson
d={"error_code": 0,"stu_info": [
{"id": 314,"name": "矿泉水","sex": "男","age": 18,"addr": "北京市昌平区","grade": "摩羯座","phone": "18317155663","gold": 100},
{"id": 315,"name": "矿泉水","sex": "女","age": 27,"addr": "上海","grade": "摩羯座","phone": "18317155664","gold": 100}
]
}
with open('abc.txt','w',encoding='utf-8') as fw:#s = json.dumps(d,ensure_ascii=False,indent=4) #把字典转成json,字符串
#fw.write(s)
json.dump(d,fw,indent=4,ensure_ascii=False)
有两种方法,dump 和 dumps。被注释的两行代码中用了 dump,但两行的作用相当于最后一行。也就是说,json 自带了 dumps 方法可以直接拿到要写入的对象,写到目标文档中。
2. 读文件
1 importjson2 with open('abc.txt',encoding='utf-8') as fr:3 result =json.load(fr)4 print(type(result))
json.load() 方法,非常方便,直接返回一个字典。