敲代码累了怎么办,快用python爬小姐姐视频吧

16 篇文章 15 订阅
10 篇文章 131 订阅

前言

天天敲代码,看着逐渐光滑的头顶,那么有啥可以让我的心灵得到稍稍的安慰吗
在这里插入图片描述

这时一位大爷给了我们答案
在这里插入图片描述
那来吧,开整。

分析页面

来到主页界面看一下
在这里插入图片描述
首先第一步要拿到视频封面链接的视频页面地址,然后顺着这个地址点进去,就来到了视频播放页面
在这里插入图片描述
来到这个页面之后,我们抓取一下请求,发现居然没有视频的请求,这就说明很有可能视频链接就在页面的源代码中,凭借着多年的初级爬虫经验,我们在源代码中搜索一下“play”
在这里插入图片描述
快看,不就隔这呢
那么整个流程欧克了,就可以开始写爬虫代码了
在这里插入图片描述

具体代码

拿取视频播放页面的url

这里利用xpath的方式来拿取url,这样的方式相对于正则表达式来说更加简单,正好这里推荐一个插件xpath helper,测试xpath非常好用

下面借助这个插件先测试下我写的xpath
在这里插入图片描述
这不就全出来了

实现代码

 html = requests.get(url)
    html.encoding = 'utf-8'
    htmltext = str(html.text)
    dom_tree = etree.HTML(htmltext)
    htmlurls = dom_tree.xpath('//span[@class="cover"]/a/@href')

拿取视频的src

这里就要使用正则表达式了
使用到的正则表达式如下

# 拿取视频的url
videolink = re.compile(r'id="play-video" src="(.*?)"', re.S)

这样视频链接就拿到了,就可以开始下载了

成果

在这里插入图片描述

这一波可以看好久了
在这里插入图片描述

总结

最后还是那一句话

仅供学习,侵权立删

这次还是一个很简单的爬虫,最近一直没时间去搞一下稍微难一些的爬虫,等以后有机会在搞,除了这个还有许多简单的爬虫示例,有兴趣的可以来看一下,都很适合初学者。

爬虫专栏,快来点我呀

聊天没有表情包被嘲讽,程序员直接用python爬取了十万张表情包

两行代码爬取微博热搜,并实现邮件提醒功能,妈妈再也不用担心我吃不到瓜了 爬虫基础

python爬取4k小姐姐图片 人生苦短 我用python

python爬b站视频 人生苦短 我用python

Python爬取美女图片 爬虫基础

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小王不头秃

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值