python 根据搜索词爬虫爬取百度图片

最新推荐文章于 2022-07-11 17:40:04 发布

不当码农好不好

最新推荐文章于 2022-07-11 17:40:04 发布

阅读量462

点赞数

分类专栏： python 文件处理文章标签： python 爬虫百度图片

本文链接：https://blog.csdn.net/JZJZ73/article/details/109646859

版权

项目需要写了一个根据搜索词爬取百度图片的程序，主要实现以下多个功能：

1、指定爬取搜索词；

2、指定开始爬取的页数和爬取的总页数；

3、对爬取成功的图片进行编号，并输出爬取未成功图片的原因；

4、将每次爬取行动记录于txt文档中，留档查看。

代码如下：

# -*- coding:utf-8 -*-
import requests
import json
import re
import os
import urllib
import lxml
import time
import datetime
from urllib import request,parse
from bs4 import BeautifulSoup


class Baidu_spider():
    def __init__(self):

        # 创建文件夹
        folders = os.path.exists('C:\\Users\\Zhang\\Desktop\\pachong\\')
        if not folders:
            os.makedirs("image")

        keyword = input('输入关键字：')   # 爬取关键字
        INIT = eval(input("从第几页开始爬取："))
        N = eval(input("爬取的页数(每页20张图)："))
        tic = time.time()
        self.crawler_img(keyword,INIT,N)
        toc = time.time()
        print(&#

最低0.47元/天解锁文章

不当码农好不好

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
python 根据搜索词爬虫爬取百度图片

项目需要写了一个根据搜索词爬取百度图片的程序，主要实现以下多个功能： 1、指定爬取搜索词； 2、指定开始爬取的页数和爬取的总页数； 3、对爬取成功的图片进行编号，并输出爬取未成功图片的原因； 4、将每次爬取行动记录于txt文档中，留档查看。代码如下：# -*- coding:utf-8 -*-import requestsimport jsonimport reimport osimport urllibimport lxmlim...
复制链接

扫一扫