尤果小爬虫

最新推荐文章于 2023-12-06 10:15:03 发布

仆角

最新推荐文章于 2023-12-06 10:15:03 发布

阅读量1.2k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qinshan7/article/details/80841546

版权

Python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

import urllib
from urllib import request
import re
import os

p = os.getcwd()
try:
    os.makedirs( r'%s\Female2'%p )
except:
    pass
os.chdir('%s\Female'%p)
y = 200

def getImg(html):
    a = "http://img.ugirls.tv/uploads/magazine/content/\w*.jpg"
    imgre = re.compile(a)
    imglist = re.findall(imgre,html)
    return imglist

if __name__ == '__main__':

    urls =[]
    baseurl = 'http://www.ugirls.com/Content/List/Magazine-%s.html'

    for i in range(y,300):
        pn = i
        urls.append(baseurl%i)

    for url in urls:
        try:
            rsp = request.urlopen(url)
            html = rsp.read().decode("utf-8")
            x = 1
            for imgurl in getImg(html):
                #保存到本地
                urllib.request.urlretrieve(imgurl, '%s-%s.jpg' %(y,x))
                x += 1
            y += 1
        except:
            pass

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

仆角

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
尤果小爬虫

import urllibfrom urllib import requestimport reimport osp = os.getcwd()try: os.makedirs( r'%s\Female2'%p )except: passos.chdir('%s\Female'%p)y = 200def getImg(html): a = "http:...
复制链接

扫一扫