Python开源网络爬虫或网络蜘蛛scrapy入门遇到问题

最新推荐文章于 2022-12-18 12:10:38 发布

csupengu

最新推荐文章于 2022-12-18 12:10:38 发布

阅读量1.2k

点赞数

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csupengu/article/details/8883598

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

踏过千山万水，峰回路转，终于装上了scrapy爬虫构架。接着参照网上写一个demo。

中文demo：http://www.cnblogs.com/txw1958/archive/2012/07/16/scrapy-tutorial.html

英文原创demo：http://doc.scrapy.org/en/0.16/intro/tutorial.html

由于疏忽，在spider目录下的蜘蛛程序中，有那么一段代码：

filename = response.url.split("/")[-2]

敲入时少了后面的 [-2]，于是

filename = response.url.split("/")

然后运行，问题就来了

一下子被吓倒了，貌似问题出现在Twisted模块，是不是装Twisted版本不对导致的。Google一下，找到有类似的问题，按网上做，还是没解决。此时已经严重怀疑是Twisted版本问题导致的，不过这时还不想重装Twisted，毕竟太麻烦了。于是到英文scrapy.org网站找scrapy demo例子。照搬下来，居然可以正常运行了！！！此时证明不是Twisted版本问题，发现自己代码少了[-2]的缘故。分析一下，可能是open（）这个函数是继承Twisted的open（），从而错误提示指向Twisted模块。这种错误提示没什么价值，反而有很大的误导性。

所以啊，有时候程序的错误提示并不是问题的真正所在。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python开源网络爬虫或网络蜘蛛scrapy入门遇到问题

踏过千山万水，峰回路转，终于装上了scrapy爬虫构架。接着参照网上写一个demo。中文demo：http://www.cnblogs.com/txw1958/archive/2012/07/16/scrapy-tutorial.html英文原创demo：http://doc.scrapy.org/en/0.16/intro/tutorial.html由于疏忽，在spider目
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。