使用python-mmap快速复制文件

最新推荐文章于 2024-06-07 10:07:57 发布

semicolon_helloword

最新推荐文章于 2024-06-07 10:07:57 发布

阅读量291

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/semicolon_hello/article/details/107573240

版权

python 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

最近学习python系统编程，学习到mmap：

内存映射（mmap）文件对象的行为既像bytearray 又像文件对象。你可以在大部分接受bytearray 的地方使用mmap对象；例如，你可以使用re 模块来搜索一个内存映射文件。你也可以通过执行 obj[index] = 97 来修改单个字节，或者通过对切片赋值来修改一个子序列: obj[i1:i2] = b'...'。你还可以在文件的当前位置开始读取和写入数据，并使用 seek() 前往另一个位置。

mmap对象对文件操作应该非常快，所以写了个程序测试了一下，果然效果非常好，大家可以参考一下，可能以后能用的上这个对象；

代码如下：

import mmap
import os
import multiprocessing as mp
import concurrent.futures as TPE
import argparse

global mms ,mmd

def datacopy(pos): #文件复制函数；

mmd.seek(pos[0])
mmd.write(mms[pos[0]:pos[1]])

if __name__ == "__main__" :
import time

print("task begin at time {}".format(time.strftime('%X')))
parse = argparse.ArgumentParser()

parse.add_argument("-n","--count",default="",dest="count",
help="threadnum",type=int)

parse.add_argument("-f", "--filename", default="", dest="file",
help="source filename", type=str)

args = parse.parse_args()

tn = args.count #文件分成几块，有多个线程操作复制；

filename = args.file
print(filename)

import os.path as op

filenamedes = op.basename(filename)

filenamedes = filenamedes.replace(".","_copy.")

f=open(filename,"r+b")
mms = mmap.mmap(f.fileno(),0) #mmap对象生成
size = mms.size() #取文件大小

with open(filenamedes, 'w+b') as fs:
pass

fs = open(filenamedes,"r+b")
mmd = mmap.mmap(fs.fileno(),size) #生产目标对象

part_size = int(size/tn)

print(part_size,tn,size)
pos_list =[]
for i in range(0,tn): #计算每块操作大小
if i == tn - 1 :
pos_list.append([i*part_size,size])
else:
pos_list.append([i*(part_size),(i+1)*part_size])
print(pos_list)

with TPE.ThreadPoolExecutor(max_workers = tn) as excutor: #线程池执行每块复制任务
future = excutor.map(datacopy,pos_list)

mmd.close()
mms.close() #关闭对象

fs.close()
f.close()
print("task end at time {}".format(time.strftime('%X')))

semicolon_helloword

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
使用python-mmap快速复制文件

最近学习python系统编程，学习到mmap：内存映射（mmap）文件对象的行为既像bytearray 又像文件对象。你可以在大部分接受bytearray 的地方使用mmap对象；例如，你可以使用re 模块来搜索一个内存映射文件。你也可以通过执行 obj[index] = 97 来修改单个字节，或者通过对切片赋值来修改一个子序列: obj[i1:i2] = b'...'。你还可以在文件的当前位置开始读取和写入数据，并使用 seek() 前往另一个位置。mmap对象对文件操作应该非常快，所以写了.
复制链接

扫一扫

专栏目录

semicolon_helloword CSDN认证博客专家 CSDN认证企业博客

码龄17年

健康通网络科技有限公司

91: 原创

9万+: 周排名

1万+: 总排名

6万+: 访问

: 等级

2053: 积分

872: 粉丝

1137: 获赞

13: 评论

749: 收藏

私信

关注

热门文章

分类专栏

mysql 2篇
java高并发 21篇
python 20篇

最新评论

Java 中的 Flux 类
Ivy@HPC: 这篇文章介绍了Rector库，用于Reactor编程模型，能创建和操作表示数据序列的Flux对象，比如网络请求或数据流结果。库还提供了过滤、组合和等待多个Flux的方法，非常适合在Reactive Streams规范中使用，对Java开发者很有帮助。
python中的排序（二）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python中的排序（二）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
使用pygame 编写俄罗斯方块游戏
ha_lydms: 这个博客的内容非常丰富，涵盖了很多不同的话题。我觉得自己在阅读中得到了很多新的见解。
达夫设备（Duff‘s Device）浅析
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题中的"达夫设备（Duff's Device）浅析"引起了我的兴趣。看来您对这个主题有着深入的研究和理解。我很欣赏您对技术细节的探索，并将其分享给读者。在接下来的创作中，或许您可以考虑深入探讨一些与"达夫设备"相关的实际应用案例，或是分享一些您在使用该设备时遇到的挑战和解决方案。这样的文章将进一步增加您博客的实用性，也能够帮助读者更好地理解和应用这一技术。同时，我也鼓励您在博客中保持谦虚的态度。即使您已经撰写了20篇博客，仍然有很多可以学习和分享的东西。通过与读者和其他技术爱好者的互动，您可以进一步拓宽自己的知识领域，并不断提升自己的技术水平。期待您未来更多精彩的创作，再次恭喜您！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

semicolon_helloword 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。