爬虫爬取百度特定关键字的大量图片

最新推荐文章于 2024-07-03 20:53:16 发布

falcooon_

最新推荐文章于 2024-07-03 20:53:16 发布

阅读量726

点赞数 1

分类专栏： py爱好者网络爬虫文章标签： python 正则表达式百度

本文链接：https://blog.csdn.net/falcooon_/article/details/106517201

版权

爬虫爬取百度特定关键字的大量图片

修改代码中的关键字，比如这里的是 ‘名侦探柯南’。
然后利用sublime跑起来就行了，这里有可能ip被锁定限制下载。

在这里插入图片描述

ip没有被锁定是可以正常批量下载的，代码如下:

# -*- coding: utf-8 -*-
"""根据搜索词下载百度图片"""
import re
import sys
import urllib

import requests


def get_onepage_urls(onepageurl):
    """获取单个翻页的所有图片的urls+当前翻页的下一翻页的url"""
    if not onepageurl:
        print('已到最后一页, 结束')
        return [], ''
    try:
        html = requests.get(onepageurl)
        html.encoding = 'utf-8'
        html = html.text
    except Exception as e:

最低0.47元/天解锁文章

falcooon_

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
爬虫爬取百度特定关键字的大量图片

爬虫爬取百度特定关键字的大量图片修改代码中的关键字，比如这里的是 ‘名侦探柯南’。然后利用sublime跑起来就行了，这里有可能ip被锁定限制下载。ip没有被锁定是可以正常批量下载的，代码如下:# -*- coding: utf-8 -*-"""根据搜索词下载百度图片"""import reimport sysimport urllibimport requestsdef get_onepage_urls(onepageurl): """获取单个翻页的所有图片的
复制链接

扫一扫

专栏目录