scrapy，重写spider，参数传递运行报错。

最新推荐文章于 2024-05-27 06:54:13 发布

测试小白的爬坑之旅

最新推荐文章于 2024-05-27 06:54:13 发布

阅读量807

点赞数

分类专栏： py 文章标签： scrapy

本文链接：https://blog.csdn.net/weixin_42296890/article/details/82628053

版权

spider蜘蛛类的参数传递，重写staart_url方法。
能复制的尽量别手写，大小写的区分可以调试一年。
划重点上干货
1 模块不存在
排查路径，反复报错‘模块’不存在的。文件夹添加init文件。然后将文件夹拖到python37目录中，因为这个路径是添加到了环境变量中的，可以通过import sys，sys.path查看，python中import 搜索模块会优先从sys.path中查找，至于添加sys.path.append()太坑了，只是临时添加路径。所以有兴趣的童鞋请自行爬坑
2.`import scrapy
from myweb.myfirstpjt.myfirstpjt.items import MyfirstpjtItem
class WeisuenSpider(scrapy.Spider):
name = ‘weisuen’

start_urls = [
    'http://slide.news.com.cn/k/slide_8_193_45192.html #p=1',
              ]

def __init__(self,myurl=None,*args,**kwargs):
    super(WeisuenSpider,self).__init__(*args,**kwargs)
    print("要爬取的网址为：%s"%myurl)
def parse(self, response):
    item=MyfirstpjtItem()
    item['urlname']=response.xpath("/html/head/title/text()")
    print("以下将显示爬取的网址的标题")
    print(item['urlnam

最低0.47元/天解锁文章

测试小白的爬坑之旅

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
scrapy，重写spider，参数传递运行报错。

spider蜘蛛类的参数传递，重写staart_url方法。能复制的尽量别手写，大小写的区分可以调试一年。划重点上干货 1 模块不存在排查路径，反复报错‘模块’不存在的。文件夹添加init文件。然后将文件夹拖到python37目录中，因为这个路径是添加到了环境变量中的，可以通过import sys，sys.path查看，python中import 搜索模块会优先从sys.path...
复制链接

扫一扫