python 文件 序列化 os模块

1 file 文件

你可以通过创建file对象来打开和使用文件,用于读取或写入内容,也可以使用合适的read, readline和write方法来对文件进行读取或者写入内容。最后,当你对文件操作完成后,你需要使用close方法告诉Python我们对文件使用已经结束。
文件的操作有三步:打开文件,读写文件,关闭文件

文件打开

1 打开一个文件用open()方法(open()返回一个文件对象,它是可迭代的)
myfile=open(“路径”,’打开方式’)
2 使用with打开文件进行读取,不需要关闭,自动关闭。

with open('foo.txt','r') as f:
    a=f.read()
with open('foo.txt','w') as f:
    f.write(a)

打开方式:
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

区别:
r+与w+区别 两者都可以读写,
r+在已有的文件上可以读写,若无文件则报错,并且r+重写文件内容时,会重头开始覆盖原有的内容,如写了5个字符,则替换掉原文件前5个字符
w+ 在重写文件内容时 会删除原件内容,再重新写入

读写文件

write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。
write()方法不会在字符串的结尾添加换行符(‘\n’):
语法:

fileObject.write(string)
在这里,被传递的参数是要写入到已打开文件的内容。

# 打开一个文件
fo = open("foo.txt", "w")
fo.write( "www.runoob.com!\nVery good site!\n")

# 关闭打开的文件
fo.close()

上述方法会创建foo.txt文件,并将收到的内容写入该文件,并最终关闭文件。如果你打开这个文件,将看到以下内容:

$ cat foo.txt
www.runoob.com!
Very good site!

read()方法
read()方法从一个打开的文件中读取一个字符串。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。
语法:
fileObject.read([count])
在这里,被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入,如果没有传入count,它会尝试尽可能多地读取更多的内容,很可能是直到文件的末尾。
这里我们用到以上创建的 foo.txt 文件举例。

# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str
# 关闭打开的文件
fo.close()

读取的字符串是 :
www.runoob

文件读取的其它方法:readline(),readlines()

也可以用循环实现文件读取

myread=open("foo.txt",'r')
for line in myread:
    print(line,end='')
myread.close()
关闭文件

close()方法
File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。

文件定位

tell()方法告诉你文件内的当前位置, 换句话说,下一次的读写会发生在文件开头这么多字节之后。

seek(offset [,from])方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。

如果from被设为0,这意味着将文件的开头作为移动字节的参考位置。如果设为1,则使用当前的位置作为参考位置。如果它被设为2,那么该文件的末尾将作为参考位置。

# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str

# 查找当前位置
position = fo.tell()
print "当前文件位置 : ", position

# 把指针再次重新定位到文件开头
position = fo.seek(0, 0)
str = fo.read(10)
print "重新读取字符串 : ", str
# 关闭打开的文件
fo.close()

结果:
读取的字符串是 : www.runoob
当前文件位置 : 10
重新读取字符串 : www.runoob

文件的复制
f=open('foo.txt','r')  #复制的内容文件
f1=open('fff.txt','w+')     #空文件
a=f.read()   #读出来
f1.write(a)  #写入
f.close()
f1.close()

with open('内容.txt','r') as f:
    a=f.read()
with open('复制.txt','w') as f:
    f.write(a)

#复制图片  需要转化二进制
with open('111.jpeg','rb') as f:
    a=f.read()
with open('222.jpeg','wb') as f:
    f.write(a)
使用python文件做爬虫
rom urllib import request

response = request.urlopen("http://www.baidu.com/") # 打开网站
fi = open("project.txt", 'w')                       # open一个txt文件
page = fi.write(str(response.read()))               # 网站代码写入
fi.close() 
2 序列化与反序列化

把变量从内存中变成可存储或传输的过程称之为序列化,序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化

通过将对象序列化可以将其存储在变量或者文件中,可以保存当时对象的状态,实现其生命周期的延长。并且需要时可以再次将这个对象读取出来。

Python提供两个模块来实现序列化:cPickle和pickle。这两个模块功能是一样的,区别在于cPickle是C语言写的,速度快,pickle是纯Python写的,速度慢,跟cStringIO和StringIO一个道理。用的时候,先尝试导入cPickle,如果失败,再导入pickle

pickle.dumps()方法把任意对象序列化成一个str,然后,就可以把这个str写入文件。或者用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object。
当我们要把对象从磁盘读到内存时,可以先把内容读到一个str,然后用pickle.loads()方法反序列化出对象,也可以直接用pickle.load()方法从一个file-like Object中直接反序列化出对象。

由于pickle写入的是二进制数据,所以打开方式需要以wb和rb的模式:

try:
    import cPickle as pickle
except ImportError:
    import pickle
# 序列化
with open('abc.txt', 'wb') as f:
    dic = {'age': 23, 'job': 'student'}
    pickle.dump(dic, f)   #把该字典写入abc.txt文件,但里面保存的是对象,是一个乱七八糟的信息
# 反序列化
with open('abc.txt', 'rb') as f:
    aa = pickle.load(f)
    print(aa)
    print(type(aa))  # <class 'dict'>

结果:
{‘age’: 23, ‘job’: ‘student’}

3 os模块

os.rename(“旧文件名”,”新文件名”)
os.mkdir(“”) 创建文件夹
os.rmdir(“”) 删除文件夹
os.getcwd()得到当前路径
os.listdir(“./”) 获取当前路径下的所有文件,返回一个文件集
os.chdir(文件夹) 改变当前路径

os模块也可以做文件的读写。

import os, sys
# 打开文件
fd = os.open("foo.txt", os.O_RDWR | os.O_CREAT)
#  写入字符串
os.write(fd, b"This is test")   #b 转化二进制
# 关闭文件
os.close(fd)
print("关闭文件成功!!")

a=os.getcwd()
print(a)
os.chdir('d:\\微信\\')
print(os.getcwd())

结果:
关闭文件成功!!
E:\python\python\python\文件
d:\微信

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值