软件使用到以下模块:
import re #正则表达式
import requests #网页爬虫
import os #文件系统
import random #随机
import threading #多线程
import time #时间
部分源代码透露
if str(total) == "<Response [200]>":
print("网络正常:",total,"\n——————————————————————")
input("输入回车开始:")
else:
print("\033[31m网络异常:\033[0m",total,"\n——————————————————————")
input("输入回车\033[31m关闭\033[0m:")
os._exit()
》》》》》》》》》》》》》》》》》》》》
for thread in threads:
time.sleep(time1)
thread.start() #多线程启动
》》》》》》》》》》》》》》》》》》》》
page(urlsum[munber])#第一页爬取
for it in list(range(int(uu))):#第n页爬取
page(urlsum[munber]+index%it)
重要的代码:
编码转换
html = total.text.encode('ISO-8859-1').decode("gbk")#编码转换
URL和图片名提取
uu = re.search("<span class=\".*?\">…</span><a href=\".*?\">(?P<ee>\d+)</a>",html)
多线程
for i, u in urlname: # i=url u=name
threads.append(threading.Thread(target=image,args=(i,u,)))#多线程创建
for thread in threads:
time.sleep(time1)
thread.start() #多线程启动
for thread in threads:
thread.join() #多线程等待关闭
效果如下
下载地址(附带单线程),免费下载