Python简易爬虫,爬取斗鱼颜值美女!!

代码简单用作初学Python,只要运行脚本图片自动下载根据,斗鱼网页更新而更新!!
QQ学习交流群127591054
JackChiang

Python版本3.5

<1>版本1,效果如图片,存在问题不能给图片加自己的名字,代码不够灵活。版本2解决这个问题

#coding=utf-8
#爬取斗鱼颜值妹子图片
import re
import urllib
import time

#定义为方法
def getHTML(url):
    page = urllib.urlopen(url)
    html=page.read()
    return html

#开始根据链接爬图片保存数据
def getImage(html):
    imagelist = re.findall(r'data-original="(.*?\.jpg)"',html);
    print imagelist
    x=0
    for imageone in imagelist:
        print('开始下载:%s'%imageone)
        urllib.urlretrieve(imageone,'C:\\Users\\JackChiang\\Pictures\\PythonData\\%d.jpg'%x)
        x+=1
        time.sleep(0.5)
fileimg = getHTML('https://www.douyu.com/directory/game/yz')
print fileimg
getImage(fileimg)



#斗鱼颜值地址:https://www.douyu.com/directory/game/yz

效果图~~~
这里写图片描述

<2>版本2更灵活一些

#coding=utf-8
#爬取斗鱼颜值妹子图片
import re
import urllib.request 
import time
from bs4 import BeautifulSoup

#定义为方法
def getHTML(url):
    page = urllib.request.urlopen(url)
    html=page.read()
    return html

#开始根据链接爬图片保存数据
def getImage(html):
    #创建对象,传入网页数据
    soup1 = BeautifulSoup(html)
    soupL = soup1.select('#live-list-contentbox')
    print(str(soupL))
    strone = str(soupL)
    soup2 = BeautifulSoup(strone)
    soupLi = soup2.select('li')
    for soupLione in soupLi:
            #获取单个li标签获取数据
           soupone = BeautifulSoup(str(soupLione))
           name = soupone.a['title']
           print('开始下载:%s'%name)
           url = soupone.img['data-original']
           try:
               urllib.request.urlretrieve(url,'C:\\Users\\JackChiang\\Pictures\\PythonData\\%s.jpg'%name)
               print(url)
           except OSError:
               print('出现异常,地址为:%s'%url)
           finally:
               time.sleep(0.5)

fileimg = getHTML('https://www.douyu.com/directory/game/yz')
getImage(fileimg)



#斗鱼颜值地址:https://www.douyu.com/directory/game/yz

代码运行状态
这里写图片描述

效果图

这里写图片描述

后续版本会有更好效果!!

  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值