url='https://www.huya.com/145472'
response=requests.get(url)
text=response.text
#不加上re.MULTILINE | re.DOTALL提取所有var TT_ROOM_DATA数据
pattern=re.findall(r'var TT_ROOM_DATA =(.*)',text)
#加上re.MULTILINE | re.DOTALL提取所有var数据
# pattern=re.findall(r'var TT_ROOM_DATA =(.*);',text,re.MULTILINE | re.DOTALL)
data=json.loads(pattern[0])
print(data['type'])
上面代码出现标题报错原因,
未加冒号导致结果多一个冒号
正则表达式()里面的表示要提取的内容,.*表示任意字符串