有时候爬虫时直接返回的不是json格式,不能直接解析,这时候要去掉非json部分,然后解析json就可以了。
#拿jsonpCallback里面的json:
filter = re.findall("(jsonpCallback.*?\().+",response)[0]
有时候爬虫时直接返回的不是json格式,不能直接解析,这时候要去掉非json部分,然后解析json就可以了。
#拿jsonpCallback里面的json:
filter = re.findall("(jsonpCallback.*?\().+",response)[0]