python使用requests爬虫抓取美女图片网站图片

import requests
from lxml import etree
from urllib.request import urlretrieve

url = 'https://www.2717.com'
show_num = 0


for page_num in range(217):
    page = 'https://www.2717.com/ent/meinvtupian/list_11_' + str(page_num+1) + '.html'

    result = requests.get(page)
    html = etree.HTML(result.content)

    # div_list = html.xpath('/html/body/div[2]/div[7]/ul/li[1]/a[1]/i/img')
    # for item in div_list:
    #     print(item.get('src'))
    #     urlretrieve(item.get('src'), './image/test.jpg')

    for i in range(30):
        path = '/html/body/div[2]/div[7]/ul/li[' + str(i+1) + ']/a[1]'
        #print(path)
        div_list = html.xpath(path)
        for item in div_list:
            girl_path = url + item.get('href')
            #print(girl_path)

            html_result = requests.get(girl_path)
            html_detail = etree.HTML(html_result.content)
            elem_list = html_detail.xpath('//*[@id="pageinfo"]')
            for elem in elem_list:
                #print(elem.get('pageinfo'))
                image_count = int(elem.get('pageinfo'))
                for image_num in range(image_count):
                    #print(girl_path)
                    a = girl_path.split('.')
                    image_url = a[0] + '.' + a[1] + '.' + a[2] + '_' + str(image_num + 1) + '.html'
                    print(image_url)

                    try:
                        image_result = requests.get(image_url)
                        html_image = etree.HTML(image_result.content)
                        image = html_image.xpath('//*[@id="picBody"]/p/a[1]/img')
                        for item in image:
                            #print(item.get('src'))
                            if show_num <= 6962:
                                show_num += 1
                                continue

                            urlretrieve(item.get('src'), './image/' + str(show_num) + '.jpg')
                            show_num += 1
                    except Exception as e:
                        pass


#完工,拜拜

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
此源码为了缩减内容不带任何图片数据,请搭建后自己采集或者录入,采集不会的话可以百度找一下采集教程,,也可以直接去淘宝上找做采集的,价格也不是很贵! 本帖资源标签:WordPress自适应图片主题,主题模板,带会员积分下载系统 分类和标签添加筛选功能; 列表增加用户自定义排序功能,支持点赞和浏览数量排序; 优化二级菜单和三级菜单的css样式; 支持会员功能和用户中心模板; 支持第三方快速登陆(QQ和新浪); 新增单图模式,全新的图片浏览模式; 新增登陆、注册、找回密码三合一页面模板; 新增文章点赞排行榜页面; 新增AJAX列表加载功能; 新增广告投放面板; 支持点卡充值和点卡生成功能; 支持积分签到功能; 支持评论和投稿奖励积分功能; 支持积分开通会员功能(目前内置3个级别的会员); 支持积分下载资源和免费资源下载; 支持vip免费资源添加; 新增下载资源管理员和作者查看下载次数和校验资源功能; 支持文章前台投稿功能; 支持前台开启相对地址和绝对地址切换功能; 新增图片自动分页功能; 新增图片分页浏览模板; 新增后台列表显示缩略图和封面图片功能; 全新的SEO功能; 新增文章收藏功能; 新增文章顶踩功能(踩的按钮目前只在单图模式显示); 新增图片预加载功能; 幻灯片支持外链和自定义大图; 源码测试环境推荐php5.2/5.3/5.4Mysql 安装说明: 上传文件拿到网站根目录,直接安装即可,附带wordpress。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

anton8801

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值