<script type="application/ld+json">
{
"@context": "https://ziyuan.baidu.com/contexts/cambrian.jsonld",
"@id": "https://www.zhihu.com/question/30737616",
"appid": "否",
"pubDate": "2015-05-28T08:48:48",
"upDate": "2016-06-07T11:43:49"
}</script>
比如要获取pubDate的值,可以通过如下方式实现:
pubDate=json.loads(bs.find('script', {'type': 'application/ld+json'}).get_text())["pubDate"]
也就是要用到json库,通过find()以及get_text()获取标签整体内容,为字符串格式。将此字符串传递给json.loads()即可得到一个字典对象,再通过["键"]的方式即可得到对应的值
上面对应的输出结果如下