爬虫爬取网站‘斗图吧’的表情包，带源码

最新推荐文章于 2022-11-16 08:00:00 发布

自己挖坑自己填

最新推荐文章于 2022-11-16 08:00:00 发布

阅读量660

点赞数

分类专栏：爬虫 python 文章标签： python

本文链接：https://blog.csdn.net/guanbinzhang/article/details/113248991

版权

爬虫爬取网站斗图吧的表情包，带源码

"""
爬取网站：斗图啦
爬取方式：XPATH 
"""

import requests
import parsel
import concurrent
#import os,sys
import time





'''

表情包python多线程爬取

requests：数据请求模块
parsel：数据解析模块

思路:
1，确定正确的url地址（静态网页\动态网页（动态加载<涉及到数据库查询>））
2，请求数据--requests（模拟浏览器请求数据库的数据，但是请求到的是范数据）
3，数据解析--parsel（解析范数据）
4，保存数据（本地文件\数据库）
'''
wq = input('enter a word:')

params = {
   
    'keyword':wq
}
page_list = [1,2,3,4,5,6