爬取网站上的图片
- 该博客只是简单教学分享,若有侵权问题敬请告知;
- 该博客只是小白学爬虫的分享爬取网页图片(无登录后爬取操作)
- 爬虫应遵守社会主义核心价值观,不要无脑爬,给站长造成不必要的麻烦
爬取的网址:添加链接描述
只是从第二页开始爬取,第一页网址稍微有点变化…
注意!!!看清楚原图网址,不要爬成缩略图。。。
效果图:
代码:
'''
爬取初始网站:http://pic.netbian.com/index_2.html class_="slist"
爬取单个图片网站:如:http://pic.netbian.com/tupian/25395.html class_="photo-pic"
图片保存在:dir_name = '.\\4K美图'
'''
import os # 文件操作
import time # 设置时间,防止服务器崩溃
import requests
from bs4 import BeautifulSoup # 网页解析,获取数据
import re # 正则表达式,进行文字匹配
import urllib.request, urllib.error
# 主函数
def main():
for i in range(7,8): # 设定爬取页数(该网站不能从第一页爬取)
baseurl = "http://pic.netbian.com/index_"+str(i)+".html"
# 爬取数据
getData(baseurl