使用etree爬取视频

 爬虫常用的几个库中,各有所长,不过目的都是一样的,今天写了个用etree函数的爬虫来爬取视频素材,分享一下

#https://ibaotu.com/shipin/
import requests
from lxml import html  
etree=html.etree


class climb():
    def __init__(self):
        self.url='https://ibaotu.com/shipin/'
        self.hearders={

        }  #测试后发现这个网站不需要header也是可行的

    def get_text(self,num):
        self.url=self.url+'7-0-0-0-0-'+str(num)+'.html'
        print(self.url)
        respond=requests.get(url=self.url)
        html=etree.HTML(respond.content.decode())
        title=html.xpath('//span[@class="video-title"]/text()')
        link=html.xpath('//div[@class="video-play"]/video/@src')
        for i,j in zip(title,link):
            self.down_mp4(i,j)

    def down_mp4(self,name,link):
        file_name=name+'.mp4'
        file=requests.get("http:"+link).content
        path=r"E:\\untitled\\视频\\"+file_name
        print('正在下载视频'+name)
        with open(path,'wb')as f:
            f.write(file)

    def all_main(self):
        num=int(input('请输入要爬取的页数1-223:'))
        for i in range(1,num+1):
            self.get_text(i)
            self.__init__() #初始化了一下url,其实可以用其他方式,比如直接赋值

if __name__ == '__main__':
    run=climb()
    run.all_main()

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值