python-scrapy教程（二）：网页跳转

最新推荐文章于 2024-07-09 02:04:32 发布

穿裤衩的文叔

最新推荐文章于 2024-07-09 02:04:32 发布

阅读量6.8k

点赞数 6

分类专栏： Python 文章标签： Python 正则表达式爬虫网络编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Topkipa/article/details/68486693

版权

Python 专栏收录该内容

35 篇文章 0 订阅

订阅专栏

我们接着上一教程开始讲解scrapy中网页的跳转

首先，先看我们要采集的网站：优酷list列表--http://list.youku.com/category/show/c_96_r_2017_s_1_d_1_p_1.html

我们所要采集的信息呢在这个详情页

这个详情页是通过播放页的节目简介这儿的入口进入的

接下来我们看看代码（只需要在教程一中的代码进行修改）：

settings设置：

记住设置items.py中的参数，例如我们设变量title和actor分别表示电影名和演员名，那么：

好了，大家可以跟着这个思路做做翻页的效果，即那个url的list不止一页，现在如果我想采集这一分类下的所有电影，那么应该怎么做呢？

穿裤衩的文叔

关注

6
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。