pyqt5 的多线程（QThread）遇到的坑（二）

置顶慧涵科技

已于 2023-07-08 18:31:08 修改

阅读量5.7k

点赞数 5

分类专栏： pyqt5的坑文章标签： python 多线程

于 2020-03-11 19:52:56 首次发布

本文链接：https://blog.csdn.net/wuwei_201/article/details/104803019

版权

pyqt5的坑专栏收录该内容

4 篇文章 3 订阅

订阅专栏

前言

前面在pyqt5多线程（QThread）遇到的坑（一）中提到了先实例化类，再把实例对象传参到线程类，这样的确实可行，但是还是遇到了新坑。
pyqt5多线程（QThread）遇到的坑（一

起因

被实例化的类是做数据处理的，传入和导出的的数据比较大，最少都是几万行的excel表格数据（pandas.DataFrame)，而且传入的数据最少两个pandas.DataFrame表，多的时候会传入7个，而且有一些数据是公共数据，每次处理都必须处理的，直接放在数据处理类的初始化__init__中了，而这部分数据处理也是稍微有的耗时，那么坑就来了，先实例化数据处理类，那么这部分稍微耗时的数据处理也会导致UI界面卡死一小会，郁闷！虽然是卡死一小会，但我们是多线程处理，还会又卡死的现象那这个多线程的意义岂不是大打折扣。其实一开始并不知道是这里的先实例化导致的，经过反复实验后才发现，既然确定了这里的问题，那就只能把实例化的过程放到线程内了，但是放到线程内，那给这个数据分析类传参怎么办？

处理方法

反复实验后，总结爬坑路线如下：
修改数据分析类的参数格式为：字典 → 把多线程类在最后增加一个参数“**kwargs”→在线程内实例化数据分析类 → 直接把多线程类接受数据的参数kwargs扔进去→数据分析类内接受数据的全局变量需要调整下，增加try，因为不是每次都传入所有数据，没有传入的数据会报错。

整体代码逻辑：

class main(object):
	def analyze_data(self, pick_filename: str):
	    """
	    数据分析,使用多线程启动数据分析
	    """
	   # 之前是先实例化数据分析类再启动线程，数据分析类初始化时也耗时，会导致UI卡死一会，这里把实例化工作放到线程内进行
	  self.analyze_thread = MoreThreadAnalyze(path_name, data0=self.in_out_data, data1=data)  # path_name 分析后文件保存路径，data0和data1是这次要传入的两个几万行的pandas.DataFrame
	  self.analyze_thread.end_signal.connect(self.alert_win)
	  self.analyze_thread.start()  # 启动线程
	
	def alert_win(self, path):  # 接受线程结束信号的槽
		print(path)


  class MoreThreadAnalyze(QtCore.QThread):
	  """
	  使用多线程进行出入库数据修改，传递数据为pandas.DataFrame 不能用信号传递，直接写入二进制文件pickle
	  pick_name: 将要保存的文件路径和文件名（pick文件）
	  **kwargs: 传入要分析的数据
	  """
	  end_signal = QtCore.pyqtSignal(str)
	
	  def __init__(self, pick_name: str, **kwargs):
	      super().__init__()
	      self.kwargs = kwargs  # 这里将得到一个字典，字典的value就是传递的pandas.DataFrame 表格
	      self.pick_name = pick_name  # 分析完成后保存文件的路径
	
	  def run(self):  
	      self.instense_name = TMDataAnalyze(self.kwargs)  # 线程内实例化数据分析类，直接把
	      data = self.instense_name.more_prepare_analyze()  # 数据分析并获得分析结果,其实这里是应该加判断的，数据分析类内不是只有more_prepare_analyze()这一个分析方法，所有这样里应该按传入的数据是哪个表格，以启动对应的数据分析方法，if判断相信你懂的，这里省略了。
	      data.to_pickle(self.pick_name)  # 把分析后数据保存为 pickle文件
	      self.end_signal.emit(self.pick_name ) # 发出信号告诉UI本线程结束，顺便把保存文件路径再传递出去
  
  class TMDataAnalyze(object):
	  """
	  导入数据，并进行分析, 参数：
	  data:需要分析的源数据，字典格式
	  """
	  def __init__(self, data: dict):
	  """
	  这里定义的全局变量前必须加try了，因为不是每次都传入全部参数，没有传入的会报错，导致程序崩溃
	  """
	      try:
	          self.data0 = data["data0"] 
	      except Exception as er:
	          print(er)
	          self.data0 = None
	      try:
	          self.data1 = data["data1"] 
	      except Exception as er:
	          print(er)
	          self.data1 = None
	      try:
	          self.data2 = data["data2"]  
	      except Exception as er:
	          print(er)
	          self.data2 = None
	      try:
	          self.data3 = data["data3"] 
	      except Exception as er:
	          print(er)
	          self.data3 = None
	      try:
	          self.data4 = data["data4"]  
	      except Exception as er:
	          print(er)
	          self.data4 = None
	      try:
	          self.data5 = data["data5"]  
	      except Exception as er:
	          print(er)
	          self.data5 = None
	          ......

     def more_prepare_analyze(self):
     	pass  # 具体数据分析过程省略
        
  if __name__ == "__main_":
  	ana = main()
  	ana.analyze_data()

总结

个人完成后再猜测这样做的优缺点，除了解决了当前UI卡一会的问题之外，还应该有两点：
缺点：线程类被强制耦合了，只能用在数据分析这个模块了。不过也不是大问题，线程类比较简单，十几行代码，再创建一个公用就是了。
优点：原来实例化是在UI主线程全局中的，那么数据分析完成后，数据保存文件，但原来那些赋值为十几万行表格的变量一直在呀！多占资源！放在线程中，运行完就结束了，应该是节省了资源吧！