Python多线程实战：多线程并行很快，但写文件要加锁

WinterShiver

已于 2023-09-20 16:49:55 修改

阅读量612

点赞数

分类专栏： Python 文章标签： python 数据库后端

于 2023-09-20 10:23:56 首次发布

本文链接：https://blog.csdn.net/WinterShiver/article/details/133067351

版权

Python 专栏收录该内容

30 篇文章 2 订阅

订阅专栏

在用Python批量处理某些事务时，一个定式如下：

def do_sth(item):
	# 一些事务

for item in items:
	do_sth(item)

如果每一个item的处理是可以乱序执行的，我们可以多线程并行执行，起到加速效果：

from multiprocessing.pool import ThreadPool

def do_sth(item):
	# 一些事务

pool = ThreadPool(processes=32)
for item in items:
    pool.apply_async(func=do_sth, args=(item,))
pool.close()
pool.join()

有的时候do_sth涉及到写文件，这种时候需要在写文件的时候加锁，保证同时至多有一个线程访问该文件，从而保证正确性：

from multiprocessing.pool import ThreadPool
from threading import Lock

with open('test.txt', 'w') as f:

	def do_sth(item):
		# 一些事务
		with lock:
			f.write('something')
		# 一些事务
	
	pool = ThreadPool(processes=32)
	for item in items:
	    pool.apply_async(func=do_sth, args=(item,))
	pool.close()
	pool.join()

如果不加锁的话，可能会出现写入混乱，最终的文件中包含0xc4这样的乱码。在读取这样的写入结果文件时（使用open），会报形如以下的UnicodeDecodeError：

UnicodeDecodeError:‘utf-8‘codec can‘t decode byte 0xc4 in position 0: invalid continuation byte

一个补救方式是手动检查文件中的非Unicode字符并删掉。在vim里可以使用以下正则表达式来匹配非英文字符：

/[^a-zA-Z0-9{}": /_.,?'!#$%&*()-+-\\\;><=|~`\[\]^@]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

WinterShiver

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python多线程读取数据用不用锁_对Python多线程读写文件加锁的实例详解

weixin_30663839的博客

01-12

720

Python的多线程在io方面比单线程还是有优势，但是在多线程开发时，少不了对文件的读写操作。在管理多个线程对同一文件的读写操作时，就少不了文件锁了。使用fcntl在linux下，python的标准库有现成的文件锁，来自于fcntl模块。这个模块提供了unix系统fcntl()和ioctl()的接口。对于文件锁的操作，主要需要使用 fcntl.flock(fd, operation)这个函数。其中...

Python并发编程详解：多线程与多进程及其应用场景

最新发布

10-11

内容概要：本文深入探讨了Python中的并发编程概念，特别是多线程与多进程的...阅读建议：针对希望理解和实现并发、并行Python程序的学习者，在实践中不断尝试使用多线程或多进程解决问题，尤其是关注效率瓶颈的情况。

参与评论您还未登录，请先登录后发表或查看评论

python 多线程读写文件_python多线程同步之文件读写控制

weixin_39854440的博客

11-21

2862

本文实例为大家分享了python多线程同步之文件读写控制的具体代码，供大家参考，具体内容如下1、实现文件读写的文件ltz_schedule_times.py#! /usr/bin/env python#coding=utf-8import osdef ReadTimes():res = []if os.path.exists('schedule_times.txt'):fp = open('sch...

python 多个线程写入文件

weixin_37037145的博客

08-29

136

我整理的一些关于【数据】的项目学习资料（附讲解～～）和大家一起分享、学习一下：https://d.51cto.com/eDOcp1使用Python实现多个线程写入文件在现代编程中，线程是实现并发操作的重要工具。Python提供了强大的线程支持，使得我们可以轻松地实现多个线程同时运行的功能。在本篇文章中，我们将学习如何使...

Python多线程写文件实例

江湖一屌丝，人间一屁民！

11-29

1288

由于最近一段时间，学了一门脚本语言-Python，原因是一、公司需要；二、只掌握Java感觉还是不够。由于需要用python分析日志，但是日志实际还没有，格式已经定了，所以我先用python写了个多线程写文件的工具，比较简单，作为一个学习总结吧，同时还遇到了一个问题，顺便将问题和解决方法也总结一下。需求：两个线程同时向一个文件中写固定格式的文件实际代码： [code="java"] ...

Python多线程写文件

daxiashangxian的博客

06-25

117

【代码】Python多线程写文件。

python 多线程写入文件

热门推荐

这里是标题

04-27

1万+

python 多线程写入文件在python中，对文件的操作时很简洁的，一般是通过打开文件，获取文件对象，然后对文件对象进行写入。这是file 的一些常用方法： class file(object): def close(self): # real signature unknown; restored from __doc__ pass...

Python应用实战：python多线程-多线程安全问题&lock与rlock.zip

03-21

总的来说，理解并正确使用锁和可重入锁是解决Python多线程安全问题的关键。在编写多线程程序时，合理地引入锁机制可以防止数据竞争，确保程序的正确性。但同时，过度使用锁可能导致程序的复杂性和性能下降，因此在...

python多线程分块读取文件

09-18

本例介绍了一个利用Python多线程实现分块读取大文件的场景。首先，我们创建一个名为`Reader`的类，该类继承自`threading.Thread`。这意味着`Reader`类将是一个可运行的线程。在`__init__`方法中，我们接收文件名、...

Python多线程:主线程等待所有子线程结束代码

09-17

总结一下，Python多线程中，要让主线程等待所有子线程结束，可以使用以下步骤： 1. 创建线程对象并指定目标函数。 2. 将线程设置为守护线程（可选，取决于你希望如何控制程序的退出）。 3. 启动线程。 4. 对每个...

多线程操作系统：并行计算的基石

09-28

多线程操作系统是现代计算机系统中的一个关键概念，它允许多个线程并行执行，从而提高了程序的执行效率和系统的响应速度。本文将详细介绍多线程操作系统的工作原理、优势、实现方式，并提供Python代码示例来演示多...

Python多线程超大日志文件解析转储写入mysql/postgresql

01-28

Python多线程超大日志文件解析转储，实现几十G超大文件并发处理。实现功能如下： 1.多线程分块解析某超大日志文件，实现超大文件多线程分块处理 2.多线程写入数据到数据库postgresql/mysql 3.线程之间通过队列queue通讯 4.出错消息通过logging写日志 @author: ray ----------web日志格式如下----------------- 21.106.138.118 - - [02/Mar/2015:16:27:22 +0800] "GET / HTTP/1.1" 200 53 21.106.138.118 - - [02/Mar/2015:16:27:22 +0800] "GET /login.jsp HTTP/1.1" 200 5464 21.106.138.118 - - [02/Mar/2015:16:27:22 +0800] "GET /CMFKMProject/KMProjectWeb/KMProWeb_Css/CM.css HTTP/1.1" 200 5941

对Python多线程读写文件加锁的实例详解

09-19

今天小编就为大家分享一篇对Python多线程读写文件加锁的实例详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

基于python的多线程例子，详细介绍了多线程处理

12-06

基于python的多线程例子，详细介绍了多线程处理，便于理解多线程

python 多线程写文件 gil_在多线程中写入文件

weixin_42523104的博客

02-19

371

不降低性能的最好方法是在所有线程之间使用一个队列，每个线程都会对一个项目进行加密，而一个主线程只需对一个项目进行解密并将其写入一个文件，当队列为空时，该队列是线程安全的，并且是阻塞的，或者如果可能的话，只需返回5个线程中的所有值，然后将其写入文件，IO往往是我们能做的最昂贵的操作之一，所以最好尽可能地限制它。在还要注意python中的线程没有利用多核，因为GIL如果您想利用多个处理引擎，则使用mu...

python多线程写文件问题_对Python多线程读写文件加锁的实例详解

weixin_39938522的博客

02-03

752

python的多线程在io方面比单线程还是有优势，但是在多线程开发时，少不了对文件的读写操作。在管理多个线程对同一文件的读写操作时，就少不了文件锁了。使用fcntl在linux下，python的标准库有现成的文件锁，来自于fcntl模块。这个模块提供了unix系统fcntl()和ioctl()的接口。对于文件锁的操作，主要需要使用 fcntl.flock(fd, operation)这个函数。其中...

python使用多线程写入数据到文件

IT之一小佬的博客

09-02

6600

python使用多线程写入数据时，可能会存在写入的一些数据丢失现象。如示例代码1所示，反复修改写入文件的两种方式和加入buffering缓冲也时存在数据丢失现象。百度众多帖子也未找到答案，最后加入了锁机制，竟然解决了数据丢失的问题！各位大佬若有好的办法，欢迎评论区留言......

python 多线程并发写文件,python中的多线程进程使用队列写入文件以检查工作是否完成...

weixin_34419203的博客

03-01

355

from multiprocessing.dummy import Pool as ThreadPoolimport multiprocessing as mpdef func(a):pthData = "C:/temp/temp.txt"with open(pthData, 'r') as file:done = file.read().splitlines()if a in done:retu...