前言
前面在pyqt5多线程(QThread)遇到的坑(一)中提到了先实例化类,再把实例对象传参到线程类,这样的确实可行,但是还是遇到了新坑。
pyqt5多线程(QThread)遇到的坑(一
起因
被实例化的类是做数据处理的,传入和导出的的数据比较大,最少都是几万行的excel表格数据(pandas.DataFrame),而且传入的数据最少两个pandas.DataFrame表,多的时候会传入7个,而且有一些数据是公共数据,每次处理都必须处理的,直接放在数据处理类的初始化__init__中了,而这部分数据处理也是稍微有的耗时,那么坑就来了,先实例化数据处理类,那么这部分稍微耗时的数据处理也会导致UI界面卡死一小会,郁闷!虽然是卡死一小会,但我们是多线程处理,还会又卡死的现象那这个多线程的意义岂不是大打折扣。其实一开始并不知道是这里的先实例化导致的,经过反复实验后才发现,既然确定了这里的问题,那就只能把实例化的过程放到线程内了,但是放到线程内,那给这个数据分析类传参怎么办?
处理方法
反复实验后,总结爬坑路线如下:
修改数据分析类的参数格式为:字典 → 把多线程类在最后增加一个参数“**kwargs”→在线程内实例化数据分析类 → 直接把多线程类接受数据的参数kwargs扔进去→数据分析类内接受数据的全局变量需要调整下,增加try,因为不是每次都传入所有数据,没有传入的数据会报错。
整体代码逻辑:
class main(object):
def analyze_data(self, pick_filename: str):
"""
数据分析,使用多线程启动数据分析
"""
# 之前是先实例化数据分析类再启动线程,数据分析类初始化时也耗时,会导致UI卡死一会,这里把实例化工作放到线程内进行
self.analyze_thread = MoreThreadAnalyze(path_name, data0=self.in_out_data, data1=data) # path_name 分析后文件保存路径,data0和data1是这次要传入的两个几万行的pandas.DataFrame
self.analyze_thread.end_signal.connect(self.alert_win)
self.analyze_thread.start() # 启动线程
def alert_win(self, path): # 接受线程结束信号的槽
print(path)
class MoreThreadAnalyze(QtCore.QThread):
"""
使用多线程进行出入库数据修改,传递数据为pandas.DataFrame 不能用信号传递,直接写入二进制文件pickle
pick_name: 将要保存的文件路径和文件名(pick文件)
**kwargs: 传入要分析的数据
"""
end_signal = QtCore.pyqtSignal(str)
def __init__(self, pick_name: str, **kwargs):
super().__init__()
self.kwargs = kwargs # 这里将得到一个字典,字典的value就是传递的pandas.DataFrame 表格
self.pick_name = pick_name # 分析完成后保存文件的路径
def run(self):
self.instense_name = TMDataAnalyze(self.kwargs) # 线程内实例化数据分析类,直接把
data = self.instense_name.more_prepare_analyze() # 数据分析并获得分析结果,其实这里是应该加判断的,数据分析类内不是只有more_prepare_analyze()这一个分析方法,所有这样里应该按传入的数据是哪个表格,以启动对应的数据分析方法,if判断相信你懂的,这里省略了。
data.to_pickle(self.pick_name) # 把分析后数据保存为 pickle文件
self.end_signal.emit(self.pick_name ) # 发出信号告诉UI本线程结束,顺便把保存文件路径再传递出去
class TMDataAnalyze(object):
"""
导入数据,并进行分析, 参数:
data:需要分析的源数据,字典格式
"""
def __init__(self, data: dict):
"""
这里定义的全局变量前必须加try了,因为不是每次都传入全部参数,没有传入的会报错,导致程序崩溃
"""
try:
self.data0 = data["data0"]
except Exception as er:
print(er)
self.data0 = None
try:
self.data1 = data["data1"]
except Exception as er:
print(er)
self.data1 = None
try:
self.data2 = data["data2"]
except Exception as er:
print(er)
self.data2 = None
try:
self.data3 = data["data3"]
except Exception as er:
print(er)
self.data3 = None
try:
self.data4 = data["data4"]
except Exception as er:
print(er)
self.data4 = None
try:
self.data5 = data["data5"]
except Exception as er:
print(er)
self.data5 = None
......
def more_prepare_analyze(self):
pass # 具体数据分析过程省略
if __name__ == "__main_":
ana = main()
ana.analyze_data()
总结
个人完成后再猜测这样做的优缺点,除了解决了当前UI卡一会的问题之外,还应该有两点:
缺点:线程类被强制耦合了,只能用在数据分析这个模块了。不过也不是大问题,线程类比较简单,十几行代码,再创建一个公用就是了。
优点:原来实例化是在UI主线程全局中的,那么数据分析完成后,数据保存文件,但原来那些赋值为十几万行表格的变量一直在呀!多占资源!放在线程中,运行完就结束了,应该是节省了资源吧!