爬虫实践(一)

前言

Python拥有非常多的有意思的库,让开发出一款小程序所需的精力比使用其他语言相对较少了些,这才有了这篇文章。

 0x001

在开始编程之前,我们需要安装一些库,今天用到有request,csv,lxml,time。 其中request和lxml需要另外下载。如有需要可以在百度上搜索。

0x002 

本人呢比较喜欢看美剧,每天都会去看影视网站有没有更新,自从我学习了爬虫,我就在想,我爬下来直接看不好吗,说干就干!

首先,我们先创建个项目,添加一个fielm.py文件,让我们开始码代码吧。 wait,我们应该先分析下需求再开始,先看看网页的布局

 

 

 

这就是我们将要爬取的网页了,可以看到每个电影都以一栏栏的方式显示着,让我们来看看源码是怎样的

 

按F12进入开发者模式,点开一个标签,我们可以发现,第一栏都对应一个<div>标签,里边包含一个<a>,<span>,<div>这三个子标签,在<a>标签中,href属性指向了这个电影的内容主页 ,如下图中的网址,和href里的是不是一样呢。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值