爬虫爬取百度特定关键字的大量图片
- 修改代码中的关键字,比如这里的是 ‘名侦探柯南’。
- 然后利用sublime跑起来就行了,这里有可能ip被锁定限制下载。
- ip没有被锁定是可以正常批量下载的,代码如下:
# -*- coding: utf-8 -*-
"""根据搜索词下载百度图片"""
import re
import sys
import urllib
import requests
def get_onepage_urls(onepageurl):
"""获取单个翻页的所有图片的urls+当前翻页的下一翻页的url"""
if not onepageurl:
print('已到最后一页, 结束')
return [], ''
try:
html = requests.get(onepageurl)
html.encoding = 'utf-8'
html = html.text
except Exception as e: