python爬虫随笔3 妹子图爬虫

最新推荐文章于 2024-04-30 17:28:01 发布

VIP文章墨回首

最新推荐文章于 2024-04-30 17:28:01 发布

阅读量738

点赞数

分类专栏： Python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_23974175/article/details/78107308

版权

前言

其实最早知道python爬虫就是知乎接触的妹子图爬虫，这次等于是自己写的；很多类库都是自己喜欢那个就用那个了；

思路

首先我们需要一个导航页，然后找到我们需要的类似于列表之类的，然后得到链接集合

#通过主页导航，获取链接集合
def getPicture():
    url = "http://www.mmjpg.com/tag/meixiong"
    r = requests.get(url, headers=getHeaders());
    r.encoding = 'utf8'
    q = PyQuery(r.text)
    list = list()
    for each in q('body > div.main.topno > div.pic > ul > li>a').items():
        list.append(each.attr.href)
    for href in list:
        downLoad(href)

然后在每个链接中，我们发现，是用js加载全部图片的，这里我的处理方式是直接拿到图片地址，因为从第1张开始，编号就只是2,3,4.。。。而已；

def downLoad<

最低0.47元/天解锁文章

墨回首

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python爬虫随笔3 妹子图爬虫

前言其实最早知道python爬虫就是知乎接触的妹子图爬虫，这次等于是自己写的；很多类库都是自己喜欢那个就用那个了；思路首先我们需要一个导航页，然后找到我们需要的类似于列表之类的，然后得到链接集合 #通过主页导航，获取链接集合def getPicture(): url = "http://www.mmjpg.com/tag/meixiong" r = requests.get(
复制链接

扫一扫