最近在做项目中,要使用python,对文件拷贝有了一些了解,这里将自己理解的文件拷贝整理出来。
如下所示,文件拷贝思路:
文件拷贝,从io上来说就是读文件,写文件到另一个指定的地方。
拷贝,还有一个小细节,就是写入文件的路径,这个路径,目标文件夹后面的部分其实和源文件相同,只是src前面与dst前面不同,可以考虑通过字符串替换的方式将不同的部分替换。
总结一下拷贝思路就是:遍历源文件夹,遇到文件就读取并写入新文件,遇到文件夹,则把新文件夹路径作为源文件夹继续递归调用本方法。
下面给出一个示例:
#!/usr/bin/python
# -*- coding:utf-8 -*-
import os
'''
src - 123.txt
- 123
| - 123.txt
- 234
| - 234.txt
最终达到的效果:
dst - 123.txt
- 123
| - 123.txt
- 234
| - 234.txt
'''
def copy_dir(src, dst):
if not os.path.exists(src):
return
# 目标文件夹可能不存在,这个时候需要创建
if not os.path.exists(dst):
os.mkdir(dst)
pathes = os.listdir(src)
for p in pathes:
f_path = os.path.join(src, p)
# 目标路径作替换 src/123.txt -> dst/123.txt
dst_path = f_path.replace(src, dst)
if os.path.isdir(f_path):
# 目标目录按照源文件夹层级生成 src/234 -> dst/234
if not os.path.exists(dst_path):
os.mkdir(dst_path)
# 递归调用拷贝方法
copy_dir(f_path, dst_path)
else:
with open(f_path, 'rb') as f:
content = f.read()
with open(dst_path, 'wb') as wf:
wf.write(content)
def run():
copy_dir('src', 'dst')
if __name__ == '__main__':
run()
运行效果:
运行开始之前,没有dst目录,运行代码之后,生成了一个dst目录,目录中的层级结构和src一致。
python拷贝文件介绍完了,一般我们看到的示例,都是通过shutil来进行拷贝:
针对上述的示例,我们通过shutil.copytree('src','dst')就可以搞定。
#!/usr/bin/python
import shutil
def run():
shutil.copytree('src', 'dst')
if __name__ == '__main__':
run()
运行效果:
而我们通过查看shutil.copytree的代码,可以看到这样的源码:
copytree() -> _copytree()
copy_function() 一般指定的是copy2,而copy2里面调用了copyfile(),copyfile()调用了copyfileobj:
这里可以看到拷贝文件先进行了读,然后写入新的文件。
总的来说shutil底层逻辑更严谨,考虑了快捷方式,文件权限,跨平台等问题。