爬取js包里数据的处理(处理为json)

本文介绍了如何从以client开头的JS包中获取数据。由于返回内容包含JS函数,不能直接转换为JSON,作者通过将数据转化为字符串,然后进行切片处理,最终形成有效的JSON。总结了当常规方法失败时,可以采用字符串操作来处理类似问题。
摘要由CSDN通过智能技术生成

步骤

 数据在client开头的js包里面,直接对这个包的url发送请求

之后观察返回的数据,并不能直接使用.json转化成json,因为它返回的包括js代码里面的fun这个函数部分。

 对于这个返回对象,自己并没有查找到它是什么对象,或者是有什么具体的方法能够让他返回需要的数据。

直接采取最简单的办法,全部转化成字符串,再对字符串进行操作,主要是进行切片,距离json数据只差一点多余的部分,最后再转化成json:

text_data=response.text
str_data=str(text_data)
#切片删除不需要的部分
str_data=str_data[5:-1]
#再转化成json数据
json_data=json.loads(str_data)
html_data=json_data['data']
books_data=html_data['books']

之后对内容进行遍历,构造每一行数据,再写入文件就可以。

结果:

总结:

1需要找到数据的位置

2处理json数据的时候如果response对象使用.json失败的话,可以直接转化成字符串用正则表达式或者别的字符串的操作。

代码:

导包:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值