各位大佬好,我用如下的代码进行文本之间的相似度计算(其中相似度计算的代码未附),主要是多线程这块计算时间比单线程所用时间多了将近一半时间,我的文本量很大,想高效处理,请问为何我使用多线程还是如此之慢,以下代码该如何改进?`
import threading
data3 =data2[:10]
start_time=time.time()
for item in data3:
title = item['autn:content']['DOCUMENT']['DRETITLE']['$'].strip().replace(' ','')
content = item['autn:content']['DOCUMENT']['DRECONTENT']['$'].strip().replace('\n','').replace(' ','')
list1 = [0] * (len(data_all)+1)
new_data = title + ' ' + content
if len(data_all)>=10:
dis = int(len(data_all)/10)
j = 1
t_obj=[]
for i in range(10):
if i ==9:
t=threading.Thread(target=deal_many_data,args=(&