yestone网图片爬虫

最新推荐文章于 2020-11-30 13:13:35 发布

weixin_38185649

最新推荐文章于 2020-11-30 13:13:35 发布

阅读量115

点赞数

分类专栏： python图片爬虫文章标签： yestone python爬虫图片

本文链接：https://blog.csdn.net/weixin_38185649/article/details/102562965

版权

# -*- coding:utf-8 -*-
import os
import time
import requests
import urllib
import uuid
from pyquery import PyQuery
import json

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/75.0.3770.142 Safari/537.36"
}


def href_url_download():
    # 1.填写要爬取关键词的list.txt
    keyword_list = open("list.txt", 'r', encoding='utf-8')
    lines = keyword_list.readlines()
    keyword_list.close()
    for keyword in lines:
        keyword = keyword.strip()
        print(keyword)
        # 2.修改爬取的页数(1,101),默认爬取100页
        for pages in range(1, 5):
            page = str(pages)
            # https://www.yestone.com/search?query=%E8%8B%B9%E6%9E%9C&photo=1&page=2
            # https://www.yestone.com/yestone/images/search?query=%E8%8B%B9%E6%9E%9C&photo=1&page=2
            url = "https://ww

最低0.47元/天解锁文章

weixin_38185649

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
yestone网图片爬虫

# -*- coding:utf-8 -*-import osimport timeimport requestsimport urllibimport uuidfrom pyquery import PyQueryimport jsonheaders = { "User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) ...
复制链接

扫一扫