线程

最新推荐文章于 2022-12-24 21:37:24 发布

风尘年华

最新推荐文章于 2022-12-24 21:37:24 发布

阅读量91

点赞数

分类专栏： urlib正则文章标签：线程

本文链接：https://blog.csdn.net/weixin_43993443/article/details/100708993

版权

3 篇文章 0 订阅

订阅专栏

线程

线程池

线程
使用模块import threading
threading.Thread()	target:县城要执行的目标函数 name：线程名称 args:传参数(元组) kwargs:传参数 (字典)
start()方法	开启线程
join()方法	线程堵塞
daemon = False	(后台线程,主线程约束子线程谁知结束)
线程执行是无顺序的
线程支援是共享的

线程池
concurrent.futures import ThreadPoolExecutor
创建一个线程池
pool = ThreadPoolExecutor(max_workers=8)
往线程池中提交任务fn(要执行的任务),args(要传递的参数),*kwargs (要传递的参数)result = pool.submit(crawlPageData,url,name=‘1808’)
给线程添加后调方法(add_done_callback添加的是方法名)result.add_done_callback(done)

pyqyery解析库介绍

pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析HTML文档,易用性和解析数度都很好

Pyqyery解析库的使用
初始化pq_html = pq("") pq_html = pq(filename=path_to_html_file)
.find():查找嵌套元素
.filter(selector): 根据 class， id 筛选指定元素
.eq(index): 根据索引号获取指定元素 (index从0开始)
pq_html(selector): 通过css选择器来获取目标内容
.text()获取标签的文本
.attr(‘属性值’):获取标签属性

线程锁

创建线程
target:执行的函数
name:设置线程的名称
args:给执行的函数传递参数(tuple)
kwargs:给执行的函数传递参数（dict）
daemon:默认为Flase,主线程结束，不影响子线程执行
daemon:为True,主线程结束，子线程结束

关注