python爬虫自学

首次接触到python爬虫,自学了很久。

根据书中的爬虫案例做了一个关于最近豆瓣电影评分的钱250名的案例,虽然花费的时间很多,但是最终还是做出来了。

爬虫,三个步骤,一是获取网页链接,二是爬取数据,三是存取数据。

在构造请求表头的时候,看着有点头大,上网查找才知道其中的含义,首先选取数据,f12,然后name,还要找到head,做到第一步就头大了。

爬取数据,其实这个是最难的,要观察网页的特点,将其进行分解,然后提取,大量的操作也是通过查找才得到。

最后进行数据的导出,做成csv文件的形式,通过大量查找资料之后,其实相对来说就简单一些。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值