文件读写:
open(filename, mode) 返回file对象
filename:包含了你要访问的文件名称的字符串值
mode:决定了打开文件的模式:只读,写入,追加等。
不同模式打开文件的完全列表:
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w 打开一个文件只用于写入。文件已存在则将其覆盖。文件不存在,则创建新文件。
a 打开一个文件用于追加。
b 以二进制格式读或写
+ 可读可写
+和b可与a、w、r等结合使用,比如:
r+ 打开一个文件用于读写。
rb+以二进制格式打开一个文件用于读写
文件对象方法:
f.read()、f.readline()、f.write()、f.seek()…….
f = open('foo.txt','w') # 打开一个文件 f.write('python是一个非常好的语言。\n是的,的确非常好!!\n') # 向打开的文件写入内容 f.close() # 关闭打开的文件 '''文件对象的方法''' # 读取一个文件的内容,调用 f.read(size), 将读取一定数目的数据, 然后作为字符串或字节对象返回。 # size 是一个可选的数字类型的参数。 当 size 被忽略了或者为负, 那么该文件的所有内容都将被读取并且返回。 # f.read() # 实例1 f = open('foo.txt','r') # str = f.read() # f.readline() 会从文件中读取单独的一行。换行符为 '\n'。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。 # str = f.readline() # f.readlines() 将返回该文件中包含的所有行。 # 如果设置可选参数 sizehint, 则读取指定长度的字节, 并且将这些字节按行分割。 # str = f.readlines() # # 迭代一个文件对象,然后读取每行 for line in f : print(line,end='') #print(str) f.close() # 写文件 f = open('foo1.txt','w') # 打开 num = f.write('string') #将string写入到文件中,然后返回写入的字符数 print(num) f.close() # 要写入一些不是字符串的东西, 那么将需要先进行转换: f = open('foo2.txt','w') value = ('www.runnob.com',14) s = str(value) var = f.write(s) print(var) # f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。 print(f.tell()) f.close() # 如果要改变文件当前的位置, 可以使用 f.seek(offset, from_what) 函数。 # from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾, # seek(x,0) : 从起始位置即文件首行首字符开始移动 x 个字符 # seek(x,1) : 表示从当前位置往后移动x个字符 # seek(-x,2):表示从文件的结尾往前移动x个字符 # from_what 值为默认为0,即文件开头。 f = open('foo1.txt','rb+') f.write(b'0123456789abcdef') f.seek(5) # 移动到文件的第六个字节 s = f.read(1) print(s) f.seek(-3,2) #移动到文件的倒数第三个字节 s1 = f.read(1) print(s1) f.close()
循环读取文件:
# 在文本文件中 (那些打开文件的模式下没有 b 的), 只会相对于文件起始位置进行定位。 # 当处理一个文件对象时, 使用 with 关键字是非常好的方式。在结束后, 它会帮你正确的关闭文件。 with open('foo1.txt','r') as f : read_data = f.read() print(read_data) print(f.closed)
爬取网页内容:
from urllib import request # 打开网站 response = request.urlopen('http://www.baidu.com/') fi = open('project.txt','w') page = fi.write(str(response.read())) fi.close() r = open('project.txt','r') a = r.readlines() print(a) r.close()
pickle模块
python的pickle模块实现了基本的数据序列和反序列化。
序列化操作:将程序中运行的对象信息保存到文件中去,永久存储。
反序列化操作:从文件中创建上一次程序保存的对象。
基本接口: pickle.dump(obj, file, [,protocol])
pickle对象以读取的的形式打开file文件:x = pickle.load(file)
注解:从 file 中读取一个字符串,并将它重构为原来的python对象。
file:类文件对象,有read()和readline()接口。
import pickle #使用pickle模块将数据对象保存到文件 data1 = {'a':[1,2.0,3,4+6j], # 定义一个字典 'b':['string',u'Unicode string'], 'c':None} selfref_list = [1,2,3] selfref_list.append(selfref_list) #打开文件 output = open('data.pk1','wb') # 序列化 pickle.dump(data1,output) #将对象data1序列化到output文件中 # Pickle the list using the highest protocol available. pickle.dump(selfref_list,output,-1) output.close() #实例2 import pprint,pickle #使用pickle模块从文件中重构python对象 pk1_file = open('data.pk1','rb') # 反序列化 data1 = pickle.load(pk1_file) pprint.pprint(data1) data2 = pickle.load(pk1_file) pprint.pprint(data2) pk1_file.close()
os模块:
OS方法主要用来处理文件和目录,多数方法适用linux系统下,较少适用于windows系统
常用方法如下:
os.rename(src, dst):重命名文件或目录,从src 到 dst
os.mkdir(path[, mode]):创建一个名为path的文件夹
os.write(fd, str):写入字符串到文件描述符fd中. 返回实际写入的字符串长度
os.chmod(path, mode):更改权限
os.close(fd):关闭文件描述符 fd
os.read(fd, n):从文件描述符 fd 中读取最多 n 个字节,返回包含读取字节的字符串
os.open(file, flags[, mode]):打开一个文件,
os.dup(fd):复制文件描述符 fd
os.dup2(fd, fd2):将一个文件描述符 fd 复制到另一个 fd2
import os path = input('请输入路径(结尾加上/):') # 获取该目录下所有文件,存入列表中 f = os.listdir(path) n = 0 for i in f : # 设置旧文件(路径+文件名) oldname=path+f[n] #设置新文件名 newname = path+'a'+str(n+1)+'.txt' #用os模块中的rename方法重命名 os.rename(oldname,newname) print(oldname,'____________>',newname) print(os.path)
运行结果:
E:\pycharm\venv\Scripts\python.exe"E:/pycharm/python/prictise/9.2 OS.py"
请输入路径(结尾加上/):E:\python-workspace\python\Class\
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
E:\python-workspace\python\Class\a1.txt____________> E:\python-workspace\python\Class\a1.txt
<module 'ntpath' from 'D:\\大数据\\Python\\lib\\ntpath.py'>
Process finished with exit code 0