python 文件序列化 os模块

最新推荐文章于 2023-02-08 16:04:46 发布

qq_42350419

最新推荐文章于 2023-02-08 16:04:46 发布

阅读量187

点赞数

本文链接：https://blog.csdn.net/qq_42350419/article/details/81028236

版权

1 file 文件

你可以通过创建file对象来打开和使用文件，用于读取或写入内容，也可以使用合适的read, readline和write方法来对文件进行读取或者写入内容。最后，当你对文件操作完成后，你需要使用close方法告诉Python我们对文件使用已经结束。
文件的操作有三步：打开文件，读写文件，关闭文件

文件打开

1 打开一个文件用open()方法(open()返回一个文件对象，它是可迭代的)
myfile=open(“路径”,’打开方式’)
2 使用with打开文件进行读取，不需要关闭，自动关闭。

with open('foo.txt','r') as f:
    a=f.read()
with open('foo.txt','w') as f:
    f.write(a)

打开方式：
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w 打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
w+ 打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。一般用于非文本文件如图片等。
a 打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。

区别：
r+与w+区别两者都可以读写，
r+在已有的文件上可以读写，若无文件则报错，并且r+重写文件内容时，会重头开始覆盖原有的内容，如写了5个字符，则替换掉原文件前5个字符
w+ 在重写文件内容时会删除原件内容，再重新写入

读写文件

write()方法可将任何字符串写入一个打开的文件。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。
write()方法不会在字符串的结尾添加换行符(‘\n’)：
语法：

fileObject.write(string)
在这里，被传递的参数是要写入到已打开文件的内容。

# 打开一个文件
fo = open("foo.txt", "w")
fo.write( "www.runoob.com!\nVery good site!\n")

# 关闭打开的文件
fo.close()

上述方法会创建foo.txt文件，并将收到的内容写入该文件，并最终关闭文件。如果你打开这个文件，将看到以下内容:

$ cat foo.txt
www.runoob.com!
Very good site!

read()方法
read（）方法从一个打开的文件中读取一个字符串。需要重点注意的是，Python字符串可以是二进制数据，而不是仅仅是文字。
语法：
fileObject.read([count])
在这里，被传递的参数是要从已打开文件中读取的字节计数。该方法从文件的开头开始读入，如果没有传入count，它会尝试尽可能多地读取更多的内容，很可能是直到文件的末尾。
这里我们用到以上创建的 foo.txt 文件举例。

# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str
# 关闭打开的文件
fo.close()

读取的字符串是 :
www.runoob

文件读取的其它方法：readline(),readlines()

也可以用循环实现文件读取

myread=open("foo.txt",'r')
for line in myread:
    print(line,end='')
myread.close()

关闭文件

close()方法
File 对象的 close（）方法刷新缓冲区里任何还没写入的信息，并关闭该文件，这之后便不能再进行写入。

文件定位

tell()方法告诉你文件内的当前位置, 换句话说，下一次的读写会发生在文件开头这么多字节之后。

seek（offset [,from]）方法改变当前文件的位置。Offset变量表示要移动的字节数。From变量指定开始移动字节的参考位置。

如果from被设为0，这意味着将文件的开头作为移动字节的参考位置。如果设为1，则使用当前的位置作为参考位置。如果它被设为2，那么该文件的末尾将作为参考位置。

# 打开一个文件
fo = open("foo.txt", "r+")
str = fo.read(10)
print "读取的字符串是 : ", str

# 查找当前位置
position = fo.tell()
print "当前文件位置 : ", position

# 把指针再次重新定位到文件开头
position = fo.seek(0, 0)
str = fo.read(10)
print "重新读取字符串 : ", str
# 关闭打开的文件
fo.close()

结果：
读取的字符串是 : www.runoob
当前文件位置 : 10
重新读取字符串 : www.runoob

文件的复制

f=open('foo.txt','r')  #复制的内容文件
f1=open('fff.txt','w+')     #空文件
a=f.read()   #读出来
f1.write(a)  #写入
f.close()
f1.close()

with open('内容.txt','r') as f:
    a=f.read()
with open('复制.txt','w') as f:
    f.write(a)

#复制图片  需要转化二进制
with open('111.jpeg','rb') as f:
    a=f.read()
with open('222.jpeg','wb') as f:
    f.write(a)

使用python文件做爬虫

rom urllib import request

response = request.urlopen("http://www.baidu.com/") # 打开网站
fi = open("project.txt", 'w')                       # open一个txt文件
page = fi.write(str(response.read()))               # 网站代码写入
fi.close()

2 序列化与反序列化

把变量从内存中变成可存储或传输的过程称之为序列化，序列化之后，就可以把序列化后的内容写入磁盘，或者通过网络传输到别的机器上。反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化

通过将对象序列化可以将其存储在变量或者文件中，可以保存当时对象的状态，实现其生命周期的延长。并且需要时可以再次将这个对象读取出来。

Python提供两个模块来实现序列化：cPickle和pickle。这两个模块功能是一样的，区别在于cPickle是C语言写的，速度快，pickle是纯Python写的，速度慢，跟cStringIO和StringIO一个道理。用的时候，先尝试导入cPickle，如果失败，再导入pickle

pickle.dumps()方法把任意对象序列化成一个str，然后，就可以把这个str写入文件。或者用另一个方法pickle.dump()直接把对象序列化后写入一个file-like Object。
当我们要把对象从磁盘读到内存时，可以先把内容读到一个str，然后用pickle.loads()方法反序列化出对象，也可以直接用pickle.load()方法从一个file-like Object中直接反序列化出对象。

由于pickle写入的是二进制数据，所以打开方式需要以wb和rb的模式：

try:
    import cPickle as pickle
except ImportError:
    import pickle
# 序列化
with open('abc.txt', 'wb') as f:
    dic = {'age': 23, 'job': 'student'}
    pickle.dump(dic, f)   #把该字典写入abc.txt文件，但里面保存的是对象，是一个乱七八糟的信息
# 反序列化
with open('abc.txt', 'rb') as f:
    aa = pickle.load(f)
    print(aa)
    print(type(aa))  # <class 'dict'>

结果：
{‘age’: 23, ‘job’: ‘student’}

3 os模块

os.rename(“旧文件名”,”新文件名”)
os.mkdir(“”) 创建文件夹
os.rmdir(“”) 删除文件夹
os.getcwd()得到当前路径
os.listdir(“./”) 获取当前路径下的所有文件，返回一个文件集
os.chdir(文件夹) 改变当前路径

os模块也可以做文件的读写。

import os, sys
# 打开文件
fd = os.open("foo.txt", os.O_RDWR | os.O_CREAT)
#  写入字符串
os.write(fd, b"This is test")   #b 转化二进制
# 关闭文件
os.close(fd)
print("关闭文件成功!!")

a=os.getcwd()
print(a)
os.chdir('d:\\微信\\')
print(os.getcwd())