一、使用正则表达式提取json字符串
json_str = re.findall(r'\[.+\]', text)[0]
print(json_str)
使用正则表达式就应加一个字符“r”。要提取的是网站信息中的json语句,如图所示
就是图中中括号里的内容,所以搜索条件就是“ [] ”;但由于中括号在正则表达式中有特殊意义,所以要用到一个反转字符“ \ ”;“ [0] ”表示字符串里的第一个元素
可以得到
二、json模块
json模块是Python自带的模块, 用于json与python数据之间的相互转换
json与python数据类型的对比
在具体数据中的区别如上图
json通过以下方式实现与python类型数据的转换
具体代码
import json
# 1. 把PYTHON转换为JSON字符串
# 1.1 PYTHON类型的数据
json_str = '''[{"provinceName":"美国", "currentConfirmedCount":1179041,"confirmedCount":1643499},
{"provinceName":"英国", "currentConfirmedCount":222227,"confirmedCount":259559}]'''
rs = json.loads(json_str)
# 1.2 把PYTHON转换为JSON字符串
json_str = json.dumps(rs, ensure_ascii=False)
print(json_str)