新手,初级尝试。爬取简单网站的MM照片。写博留念。
步骤如下:
第一步:分析网站
网址:http://www.7160.com/xingganmeinv/list_3_1.html
打开网页元素,找到图片地址位置,地址在img标签下的src键中,获取每张照片的地址(http://img.7160.com/uploads/180130/12-1P1301A92Bc.jpg)然后用二进制格式保存照片。
第二步:获取页面代码
1.导入库:
#!/usr/bin/python # -*- coding:utf-8 -*- import urllib2 from bs4 import BeautifulSoup import it