爬虫爬取网站斗图吧的表情包,带源码
"""
爬取网站:斗图啦
爬取方式:XPATH
"""
import requests
import parsel
import concurrent
#import os,sys
import time
'''
表情包python多线程爬取
requests:数据请求模块
parsel:数据解析模块
思路:
1,确定正确的url地址(静态网页\动态网页(动态加载<涉及到数据库查询>))
2,请求数据--requests(模拟浏览器请求数据库的数据,但是请求到的是范数据)
3,数据解析--parsel(解析范数据)
4,保存数据(本地文件\数据库)
'''
wq = input('enter a word:')
params = {
'keyword':wq
}
page_list = [1,2,3,4,5,6