scrapy，itemloader，add_xpath()选择器返回结果为空

最新推荐文章于 2020-12-31 03:41:41 发布

艾森merlin

最新推荐文章于 2020-12-31 03:41:41 发布

阅读量863

点赞数

分类专栏：编程文章标签：爬虫，scrapy

本文链接：https://blog.csdn.net/weixin_39579124/article/details/89397269

版权

编程专栏收录该内容

5 篇文章 0 订阅

订阅专栏

 response.body.decode('gbk')
        loader = YjsLoader(item=jobSyjs(), response=response)  # 创建item loader
        loader.add_xpath('jobCompany', '//div[@class="main mleft"]//h1/text()')
        loader.add_value('jobDescription',self.getcompanyinfo(response))
        loader.add_xpath('jobAddress', '//div[@class="info clearfix"]//li[contains(.,"工作地点")]//u/text()')
        loader.add_value('jobSource', response.url)
        loader.add_xpath('jobType', '//div[@class="info clearfix"]//li[contains(.,"职位:")]//u/text()')
        loader.add_xpath('jobPubDate', '//div[@class="info clearfix"]//li[contains(.,"发布时间")]//u/text()')
        loader.add_value('jobFrom', '搜应届生')
        print(loader.item)
        return loader.load_item()

我的item定义如下：
class jobSyjs(scrapy.Item):
    table = 'joblistSyjs'
    jobCompany = scrapy.Field()  # 公司名称
    jobDescription = scrapy.Field()  # 职位描述
    jobAddress = scrapy.Field()  # 地点
    jobSource = scrapy.Field()  # job来源
    jobType = scrapy.Field()  # Job类型
    jobPubDate = scrapy.Field()  # 发布日期
    jobFrom = scrapy.Field()  # 爬取来源

如上代码， loader.add_xpath(‘jobCompany’, ‘//div[@class=“main mleft”]//h1/text()’)，为jobCompany添加了xpath选择器，正常情况是，选择器返回一个结果xxxx，那么jobCompany的值就是xxxx，但是，xpath选择器返回值为空呢，也就是网页中没有选///择器选择的内容，jobCompany这个字段什么情况，debug最后的到的loader.load_item()得到的Item只有不为空的几个字段，item的values只有jobAddress，jobSource，jobFrom
求解？？？？？？？？？？？？？

艾森merlin

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
4
评论
scrapy，itemloader，add_xpath()选择器返回结果为空

response.body.decode('gbk') loader = YjsLoader(item=jobSyjs(), response=response) # 创建item loader loader.add_xpath('jobCompany', '//div[@class="main mleft"]//h1/text()') load...
复制链接

扫一扫