Python三步爬取VMgirls小姐姐图片
具体思路
第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgirls.com,这个网站我很喜欢。嘿嘿!(你懂的)
第二步:分析目标网站的html源码及网页规则
1.请求网页
2.解析网页
3.找到图片URL
4.找到网站hearders规则
第三步:编写代码
第一步:确定目标
网址:https://www.vmgirls.com/
第二步:分析目标网站
通过开发者工具找到该网站的URL,不过该网站通过代码禁用了开发者工具。可用谷歌浏览器或者一些工具打开。
不过当我们点击UR的时候,会发现跳出404网页。不过没关系,记录下该网址。
找到该网站的headers。
第三步:代码编写
"""
Python爬取 https://www.vmgirls.com/ 网站的图片
"""
import requests
import parsel
import time
class VmGirlsPhotos(object):
"""
类说明:下载 vmgirls图片网站的图集单页面
"""
def __init__(self):
self.server = "https://www.vmgirls.com/"
self.target = "https://www.vmgirls.com/16703.html"
self.headers = {
"User-Agent"