在爬取某一页面的时候遇到了遇到json文本内容内嵌入html文件中,这种就需要通过bs4寻找后进行字符串的切割。但得到相关字符串的时候发现在将字符串转换为标准的json格式发生了一下多种错误:
1.单双引号问题:由于json格式必须使用双引号,利用json.loads的时报错
2.非标准集合形式:通过replace替换来处理第一个问题的时候发现出现了以下非法问题:
最后通过上网搜寻了解发现了一种非常好用的库json5,能够自动将字符串转变为符合json格式的json数据,具体的操作方法和json差不多,大家可以上网了解一下。