python脚本批量执行shell，使用queue、threading库

最新推荐文章于 2024-09-24 06:45:00 发布

大壮vip

最新推荐文章于 2024-09-24 06:45:00 发布

阅读量3.3k

点赞数 1

分类专栏：大数据 python ETL 文章标签：大数据 python shell 多线程数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33792843/article/details/78855666

版权

大数据同时被 3 个专栏收录

136 篇文章 0 订阅

订阅专栏

27 篇文章 1 订阅

订阅专栏

8 篇文章 0 订阅

订阅专栏

python脚本批量执行shell，使用queue、threading库

多线程队列再出江湖，搭配执行批量shell的hadoop上传sc操作。然后调试看看效果

本篇为编码操作。

和我上上家公司一样，多线程爬虫某豆荚的app应用网站，但是此次功能没有那复杂了，就是为了快点搞完。

那现在我们开始，引入Queue队列，和threading。

来看看python基础。

基本FIFO队列

class Queue.Queue(maxsize=0)

FIFO即First in First Out,先进先出。Queue提供了一个基本的FIFO容器，使用方法很简单,maxsize是个整数，指明了队列中能存放的数据个数的上限。一旦达到上限，插入会导致阻塞，直到队列中的数据被消费掉。如果maxsize小于或者等于0，队列大小没有限制。

举个栗子：

移除点击此处添加图片说明文字

输出：

移除点击此处添加图片说明文字

LIFO队列

class Queue.LifoQueue(maxsize=0)

LIFO即Last in First Out,后进先出。与栈的类似，使用也很简单,maxsize用法同上

再举个栗子：

移除点击此处添加图片说明文字

优先级队列

class Queue.PriorityQueue(maxsize=0)

构造一个优先队列。maxsize用法同上。

移除点击此处添加图片说明文字

稍微大致看一下，队列和java的思想一致。

一些常用方法

task_done()

意味着之前入队的一个任务已经完成。由队列的消费者线程调用。每一个get()调用得到一个任务，接下来的task_done()调用告诉队列该任务已经处理完毕。

如果当前一个join()正在阻塞，它将在队列中的所有任务都处理完时恢复执行（即每一个由put()调用入队的任务都有一个对应的task_done()调用）。

join()

阻塞调用线程，直到队列中的所有任务被处理掉。

只要有数据被加入队列，未完成的任务数就会增加。当消费者线程调用task_done()（意味着有消费者取得任务并完成任务），未完成的任务数就会减少。当未完成的任务数降到0，join()解除阻塞。

put(item[, block[, timeout]])

将item放入队列中。

如果可选的参数block为True且timeout为空对象（默认的情况，阻塞调用，无超时）。
如果timeout是个正整数，阻塞调用进程最多timeout秒，如果一直无空空间可用，抛出Full异常（带超时的阻塞调用）。
如果block为False，如果有空闲空间可用将数据放入队列，否则立即抛出Full异常

其非阻塞版本为

put_nowait

等同于

put(item, False)

get([block[, timeout]])

从队列中移除并返回一个数据。block跟timeout参数同

put

方法

其非阻塞方法为｀get_nowait()｀相当与

get(False)

empty()

如果队列为空，返回True,反之返回False

来看我们的代码改造：

此处没必要设置权重吧，我觉得没必要吧。

移除点击此处添加图片说明文字

恩，写入队列逻辑

移除点击此处添加图片说明文字

接下来是python多线程的基础，大致浏览一下，然后我们改造自身代码

这个人将多线程讲的挺生动的，嘿嘿引用一下。

https://www.cnblogs.com/fnng/p/3670789.html

好一句，为了不浪费你时间。

移除点击此处添加图片说明文字

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。