多线程爬取搜狐新闻QAQ遇到了不知道怎么改的bug怎么办昂
俺是是一个Python小白,跟着大佬写了下多线程爬取豆瓣网页的代码,然后想试试不整理爬取内容,能不能爬取新浪新闻QWQ(如图网页)
but代码明明只改了一部分结果出了看不懂的bug (嘤嘤 憨憨落泪)
球球带佬解答QAQ!!!万分感谢!!!(✪ω✪)
下面是代码:
# 多线程Python
import requests
import parsel
import time
import threading
# 使用get方法请求数据
def get_info(page):
response = requests.get('https://search.sina.com.cn/?q=%E5%9E%83%E5%9C%BE%E5%88%86%E7%B1%BB&c=news&from=&col=&range=/'
'all&source=&country=&size=10&stime=&etime=&time=&dpc=0&a=&ps=0&pf=0&page={}'.format(page))
print(response.text) #打印网页内容
# 总共运行时间
start_time = time.time()
# 构造url请求数据
for page in range(10):
#创造线程对象
threading.Thread(target=get_info,args=(page.)).start()
#get_info(page)
print('总线程数'.threading.enumerate())
while threading.enumerate()>1:
pass