遇到问题的场景
最近在调用【夏柔api】获取爱奇艺热搜词的时候,我在使用requests库请求到接口返回的数据之后,需要把返回的数据解析为JSON格式,一般使用json库的loads()
方法就可以直接解析成功,但是最近遇到了下面的错误
源码如下
import requests,json
url='https://v.api.aa1.cn/api/iqy-hot/index.php'
resp=requests.get(url)
resp_json=json.loads(resp.text)
报错信息如下:“JSONDecodeError: Extra data: line 1 column 6557 (char 6556)”
刚开始我没有认真看报错信息和接口返回的数据,然后在网上搜索了很多资料都没有合适的解决方案,直到我看到了接口数据的最后一行
现在我才明白了报错的原因(6625应该是接口数据的信息),要想使用json.loads()
方法解析数据,首先需要将结尾的数字去掉,解决方案如下
解决方案
正则表达式
# 采用分组匹配的方法,注意遇到小括号和中括号要进行转义
mydata=re.compile('(?P<data>{"data":\[.*?})\d+')
final_data=mydata.search(resp.text)
final_data[-10:]
>>> 'ed_sec":1}'
字符串方法
参考:【python 移除字符串尾部的数字方法】
import string
newstr=resp.text.replace('\n','').rstrip(string.digits)
newstr[-10:]
>>> 'ed_sec":1}'