Scraping a JSON response with Scrapy

最新推荐文章于 2023-05-24 22:27:22 发布

xpisme

最新推荐文章于 2023-05-24 22:27:22 发布

阅读量1.4k

点赞数

分类专栏： python 文章标签： scrapy json response string

本文链接：https://blog.csdn.net/u013303402/article/details/53353615

版权

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

scrapy 爬到的response是一个json

{
    "code": "1",
    "data": "<div> <p class='one'>  <a href='/people/yang' class='zg-link'>杨</a></p> <p class='two'>    <a href='/people/wang' class='zg-link'>王</a></p> </div>",
}

1：得到json中对应的数据

class MySpider(BaseSpider):
    ...


    def parse(self, response):
         jsonresponse = json.loads(response.body_as_unicode())

         item = MyItem()
         item["firstName"] = jsonresponse["firstName"]             

         return item

2：分析json中的html数据得到url

from scrapy.selector import Selector

以文字构造:

body = '<html><body><span>good</span></body></html>'
Selector(text=body).css('//span/text()').extract()
[u'good']

参考资料
http://stackoverflow.com/questions/18171835/scraping-a-json-response-with-scrapy
http://scrapy-chs.readthedocs.io/zh_CN/latest/topics/selectors.html

xpisme

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scraping a JSON response with Scrapy

scrapy 爬到的response是一个json{ "code": "1", "data": "<div> <p class='one'> <a href='/people/yang' class='zg-link'>杨</a></p> <p class='two'> <a href='/people/wang' class='zg-link'>王</a></p> </di
复制链接

扫一扫

专栏目录