linux下使用python截图_linux多线程网页截图-python

最新推荐文章于 2024-08-02 20:36:00 发布

yiqin luo

最新推荐文章于 2024-08-02 20:36:00 发布

阅读量655

点赞数

文章标签： linux下使用python截图

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36221923/article/details/112903498

版权

上一篇中(

linux多线程网页截图-shell

)，使用shell多进程对大量的网站截图，大大减少了截图的时间。但慢慢的也发现了这种方式的弊端：每个进程分配的网站数量是相等的，有些进程截图较快，有些较慢，个别进程在其它进程已经截图完成后，还要运行10多个小时才能把分配的网站截图完。

如何把现有的“平均分配”截图方式改成“能者多劳”呢？

刚好最近在学习python，而python可以很方便的支持多线程。找了些资料，使用threading+queue的方式实现了“能者多劳”的多线程截图方式：

#coding:utf-8

import threading,urllib2

import datetime,time

import Queue

import os

class Webshot(threading.Thread):

def __init__(self,queue):

threading.Thread.__init__(self)

self.queue=queue

def run(self):

while True:

#如果队列为空，则退出，否则从队列中取出一条网址数据，并截图

if self.queue.empty():

break

host=self.queue.get().strip('\n')

shotcmd="DISPLAY=:0 cutycapt --url=http://"+host+" --max-wait=90000 --out="+host+".jpg"

os.system(shotcmd)

self.queue.task_done()

time.sleep(1)

def main():

queue=Queue.Queue()

f=file('domain.txt','r')

＃往队列中填充数据

while True:

line=f.readline()

if len(line)==0:

break

queue.put(line)

#生成一个 threads pool, 并把队列传递给thread函数进行处理，这里开启10个线程并发

for i in range(0,10):

shot=Webshot(queue)

shot.start()

if __name__=="__main__":

main()

程序描述如下：

1、创建一个Queue.Queue() 的实例,将domain.txt里的网站列表存入到该队列中

2、for循环生成10个线程并发

3、将队列实例传递给线程类Webshot，后者是通过继承 threading.Thread 的方式创建的

4、每次从队列中取出一个项目，并使用该线程中的数据和 run 方法以执行相应的工作

5、在完成这项工作之后，使用 queue.task_done() 函数向任务已经完成的队列发送一个信号

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。