如题,本人在使用python爬取网页内容时,发现使用BeautifulSoup解析出的网页有的并不是严格的xml格式的,出现如下图所示的数据,折腾了半天,不知道这种数据如何解析,代码片段如下
for tr in soup.find_all('script', id="getxxx"):
下面就是tr的内容
如果想获取confirmedCount":730这样的值该如何写代码呢?初次接触爬虫,还望各路大神指教,谢谢啦。
如题,本人在使用python爬取网页内容时,发现使用BeautifulSoup解析出的网页有的并不是严格的xml格式的,出现如下图所示的数据,折腾了半天,不知道这种数据如何解析,代码片段如下
for tr in soup.find_all('script', id="getxxx"):
下面就是tr的内容
如果想获取confirmedCount":730这样的值该如何写代码呢?初次接触爬虫,还望各路大神指教,谢谢啦。